Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Ia edición, julio del año 2005 Ia reimpresión, junio del año 2012 ©2005-2012 UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES ZARAGOZA ©2005-2012 Por características tipográficas y de diseño editorial MIGUEL ÁNGEL PORRÚA, librero-editor Derechos reservados conforme a la ley ISBN 970-701-587-X Queda prohibida la reproducción parcial o total, directa o indirecta del contenido de la presente obra, sin contar previamente con la autorización por escrito de los editores, en términos de la Ley Federal del Derecho de Autor y, en su caso, de los tratados internacionales aplicables. Esta investigación, arbitrada por pares académicos, se privilegia con el aval de la institución propietaria de los derechos correspondientes. A Osiris, Alan y Astrid, por lo que representan para mí. A Javier y Monse, por ser lo más importante en mi vida. En la realización de este libro participó un grupo de personas con aportaciones que fueron valiosas para el buen término de este proyecto: Cinthia Cruz del Castillo, Angélica Romero Palencia, Gerardo Benjamín, Tonatiuh Villanueva Orozco, Blanca Inés Vargas Núñez y Claudia López Becerra. También queremos agradecer a Argentina López Becerra por ayudar a transcribir estos apuntes MIRNA Y SOFÍA Prólogo La investigación en psicología es fundamental para el entendimiento del comportamiento humano y para el desarrollo de programas e intervenciones efectivas. Adicionalmente, la investigación representa un proceso complejo en el que los fenómenos o constructos a investigar son multidimensionales, multicausales y multideterminados. Hacer justicia a los eventos y problemáticas estudiadas y asegurar la validez y confiabilidad de los hallazgos requiere de una sofisticación conceptual y técnica profunda y sistemática. De hecho, es necesario que diferentes investigadores indaguen distintos aspectos de un mismo problema, obteniéndose así resultados que contribuyen a explicar el fenómeno de manera integral. La obtención de hallazgos contundentes y replicables implica una conceptualización teórica sólidamente fundamentada y la realización de una serie de pasos metodológicos y estadísticos sistematizados -protocolo científico- que permitan sopesar la congruencia de los resultados con la realidad y su grado de generalización. Como uno de estos pasos, el análisis estadístico de los datos, implica la selección de pruebas estadísticas contingentes con el nivel de medición, consistentes con el método planteado y aplicados e interpretados por el investigador de manera apropiada. Para los psicólogos que consumen investigación para sus intervenciones, realizan investigaciones o están en formación, la tarea de elegir la prueba estadística adecuada, requiere de apoyo didáctico. En este sentido, el que ese sea el objetivo principal de este libro es un evento afortunado, lo cual sólo es superado por el hecho de que su utilidad se multiplique al ser un texto planteado en términos didácticos, sencillos y precisos, que les permita discernir la lógica inherente a la estadística en general y a cada prueba en particular. Con el propósito de arribar a un utensilio concreto, aplicable, práctico, claro y útil, las autoras del texto desarrollan paso a paso las diferentes pruebas estadísticas necesarias a la investigación psicológica, acompañadas de su manejo minucioso a través del paquete estadístico para las ciencias sociales (SPSS), acompañados de la forma correcta de interpretación de los resultados. Los elementos de la obra hacen de ella una consulta indispensable, a partir de un material básico y comprensible. Colateralmente, el libro ofrece la aplicación de la estadística a partir de ejemplos relacionados a los problemas sociales del país. Como punto final, además de recomendar ampliamente el uso de la obra, felicito a las autoras y al programa PAPIME de la UNAM que a través del financiamiento del proyecto EN314903 hizo este trabajo posible. ROLANDO DÍAZ LOVING Introducción La curiosidad del ser humano por saber ¿por qué? y ¿para qué? de las relaciones interpersonales, y cómo ocurren éstas en diferentes contextos -pareja, familia, amigos, trabajo, escuela, etcétera- ha generado infinidad de explicaciones y descripciones en tomo al tema. Algunas de estas explicaciones surgen de la vida cotidiana y se asumen como hechos verdaderos, sin ser cuestionados; por ejemplo, la aseveración de que las mujeres son emocionalmente débiles. Esta es una afirmación compartida por muchos, sin embargo, carece de evidencia empírica y sustento teórico que la respalde, elementos que marcan la diferencia entre las aseveraciones populares y aquellas que están sustentadas teóricamente y que son medidas rigurosamente. En el ejemplo anterior surgen preguntas como, ¿todas las mujeres?, ¿las que caen dentro de un rango de edad determinado?, ¿las solteras, casadas, viudas, divorciadas o que viven en unión libre?, ¿las que tienen determinado nivel de escolaridad?, ¿las que trabajan o las que son amas de casa?... De una afirmación aparentemente simple emanan una serie de interrogantes, lo que conduce a uno de los puntos centrales de la investigación: el objetivo que se quiere alcanzar, esto es, para delimitar lo que se va a investigar es necesario tener claridad en el propósito de la investigación. En este escenario, la estadística es una herramienta que emplea el in- vestigador para describir sus datos y para tomar decisiones. El tipo de prueba estadística a usar dependerá del objetivo de la investigación, de su diseño, del tamaño de la muestra y de sus hipótesis. De esta forma, la estadística es una colección de hechos numéricos que permiten hacer inferencias de una muestra a una población. Se clasifica en descriptiva e inferential. La estadística inferencial a su vez se clasifica en no paramétrica y paramétrica. 13 Así, la estadística es una herramienta imprescindible del psicólogo, sobre todo cuando realiza investigación. Su aplicación en el campo de la psicología no es nueva, tal como lo señala Downie y Heat (1973) quienes refieren que en la década de 1880 Cattell se relacionó con estadísticos europeos, evento que influyó en la aplicación de los métodos estadísticos en el ámbito de la psicología. De igual forma, tampoco es de sorprender la complejidad que re- presenta comprender y aplicar las pruebas estadísticas a situaciones específicas de investigación. Es el caso que al incursionar en el área de la investigación surja una serie de interrogantes con relación a, ¿qué prueba es la más adecuada para lo que se está investigando?, ¿el tipo de medición elegido será el apropiado para la prueba elegida?, ¿el modelo estadístico seleccionado: paramétrico o no paramétrico es congruente con el tamaño de la muestra y con el tipo de medición empleado? En fin, pueden ser muchas las dudas, y cuando se toman decisiones inapropiadas los resultados y conclusiones derivados de esa investigación pueden ser falsos, además de que se tiene el riesgo de cometer el error estadístico tipo 1 (Alfa) o el error estadístico tipo 2 (Beta) los cuales se describirán en este texto. Precisamente este manuscrito tiene la intención de proporcionar a los estudiantes y profesionales de la psicología un texto que incluya los ele- mentos básicos de la estadística, descritos de una manera sencilla y apo- yados con ejercicios, algunos de ellos, derivados de la investigación de la psicología en México, tratando de evitar explicaciones complicadas, por lo que las fórmulas que se presentan, así como el desarrollo de las mismas, tienen como propósito que el lector conozca las operaciones que subya- cen a cada una de éstas con la intención de que comprenda la lógica mediante la cual se obtienen. Al presente, por cuestiones prácticas es poco probable que el trata- miento de los datos, derivados de una investigación,se realice en forma manual -sobre todo cuando las muestras son grandes- lo que conduce a utilizar el paquete estadístico SPSS que permite en poco tiempo obtener Sofía Rivera Aragón 14 Mirna García Méndez resultados precisos. Sin embargo, si las instrucciones dadas al SPSS fueron erróneas, los resultados se verán alterados lo que conlleva a interpretacio- nes equivocadas. Con la intención de disminuir estos errores, después del desarrollo de las fórmulas inherentes a los estadísticos incluidos en el libro, se exponen ejercicios paso a paso de las pruebas estadísticas, a través del Statistical Package for the Social Science (SPSS: paquete estadístico aplicado a las ciencias sociales). En ambos casos -fórmulas desarrolladas y SPSS- cada ejercicio concluye con la interpretación de los resultados.1 Con base en lo aquí expuesto, el libro inicia con la exposición de los ni- veles de medición por considerarse fundamentales en la toma de decisiones referentes a los pasos que proceden en la investigación. Posteriormente se aborda lo relacionado con la estadística descriptiva en el capítulo 2, estadís- tica que nos permite hacer una descripción de los hallazgos empíricos. En este capítulo se hace énfasis en el tipo de distribución, medidas de tenden- cia central y de variabilidad, a través de una serie de ejemplos que tienen como objetivo facilitar la comprensión de los elementos expuestos. En el capítulo 3 se expone lo que compete a la estadística inferen- cial, la cual nos permite además de describir los datos encontrados, realizar generalizaciones a partir de los hallazgos reportados en una muestra a una población en términos de probabilidad. En esta parte del texto se presentan los principios que sustentan a los dos grandes modelos estadísticos derivados de la estadística inferencial: la estadística no para- métrica y la estadística paramétrica. Los capítulos 4 y 5 abordan de manera específica algunas de las pruebas no paramétricas y paramétricas más empleadas por el investigador social. En estos dos capítulos, la explicación de las pruebas es acompañada por ejemplos que permitan una mejor comprensión de las mismas. 1Debido al uso de este sofware (SPSS), varias de las tablas reportadas en los diferentes capítulos de este libro aparecerán en inglés. Introducción 15 Como parte final pero no por ello menos importante, cabe destacar que el contenido de este libro se basa en los apuntes de la cátedra sobre estadística, dictada por la doctora Sofía Rivera Aragón, en el doctorado de psicología de la Facultad de Psicología de la Universidad Nacional Autónoma de México. Es conveniente denotar que para su publicación se contó con la autorización y coautoría de la doctora Rivera Aragón. Medición Del o los objetivos de investigación derivan las fases subsiguientes del proceso de investigación. Una de estas fases se refiere al tipo de medición empleada para evaluar una o más variables de estudio, componente que tiene una relación directa con la estadística empleada en el tratamiento de los datos. De esta manera la medición consiste en reglas que asignan símbolos a objetos, de tal forma que a) representan numéricamente cantidades o atributos, o b) definen si los objetos caen en las mismas o en diferentes categorías con respecto a un atributo de medición. En esta definición, las reglas se refieren a que la asignación de números sea explícita; y los atributos denotan que la medición implica características particulares del objeto, esto es, los objetos per se no pueden medirse, se miden sus atributos (Nunnally y Bernestein, 1995). Nunnally y Bernestein, indican que los números representan cantidades en escalas de medición, lo que significa que la cuantificación implica qué tanto de un atributo está presente en un objeto. En la literatura se mencionan cuatro niveles de medición, aunque en psicología generalmente se emplean tres: nominal, ordinal e intervalar, los que se describen a continuación. Escalas de medición Nominal Es el nivel más bajo de medición de una variable en el que se le asignan números a los objetos, personas o características que se deseen evaluar, las cuales no pueden ordenarse o sumarse. Precisamente a todos los miem- bros de un conjunto se les asigna el mismo valor numérico, e.g. al preguntarles a 100 ciudadanos del Distrito Federal, ¿para usted la infidelidad es positiva o negativa? Se está empleando una medida nominal al registrar la frecuencia de las respuestas, dándole el valor de 1 a la infidelidad positiva y el valor de 2 a la infidelidad negativa, lo que se muestra en la tabla 1. Esta medición coloca los casos dentro de categorías o conjuntos, y se cuenta la frecuencia de ocurrencia, sin asignar el mismo valor a dos categorías, e.g. sexo, no se puede clasificar a la misma persona como hombre y mujer. Ordinal Requiere que los objetos de un conjunto de variables puedan ser ordenados por rangos respecto a una característica o propiedad. Los valores numéricos asignados a los objetos ordenados se llaman valores de rango. En esta medición los números no indican cantidades absolutas ni tampoco que los intervalos entre los números sean iguales, por lo que marca la organización de los rangos pero no señala la magnitud de las diferencias entre éstos, e.g. las etapas del desarrollo humano: Niñez Adolescencia Adultez Vejez TABLA 1 OPINIÓN DE LOS CIUDADANOS DEL DISTRITO FEDERAL SOBRE LA INFIDELIDAD Infidelidad Frecuencia 1 40 2 60 Sofía Rivera Aragón 20 Mirna García Méndez Otro ejemplo es el ciclo de vida de la pareja de acercamiento-alejamiento (Díaz-Loving, 1999): 1. Extraño/desconocido 2. Conocido 3. Amistad 4. Atracción 5. Pasión 6. Romance 7. Compromiso 8. Mantenimiento 9. Conflicto 10. Alejamiento 11. Desamor 12. Separación 13. Olvido Como se puede observar en ambos ejemplos, no existe una distancia exacta entre cada una de las etapas y tampoco se sabe con exactitud cuándo termina una e inicia la siguiente. Intercalar Esta medición posee las características de las escalas nominales y ordinales, de manera particular las de rango. Las distancias numéricamente iguales de los intervalos representan distancias iguales en la propiedad de la variable que se mide. En este nivel de medición se incluyen las escalas tipo Likert, e.g. la clasificación de la inteligencia a través de la escala WAIS (Barragán, Benavides, Brugman y Lucio, 1988) presentada en la tabla 2. Tal como se observa en la tabla 2, existe la misma distancia entre los diferentes niveles de medición de la inteligencia, lo que indica una distribución igual de los intervalos de medición. Medlción 21 De razón Es el nivel más alto de medición de una variable. Es una medida poco empleada en la psicología, por ende, no se hablará más de él. Con base en lo expuesto, a continuación se presenta un ejemplo que involucra tres de los cuatro niveles de medición: nomina], de rangos e intervalar. Ejemplo En una investigación que tiene por objetivo conocer la relación entre la satisfacción marital, la escolaridad y el sexo. El sexo (hombres y mujeres) es una variable nominal en la que a los hombres (H) se les asigna el valor numérico de 1 y a las mujeres (M) se les asigna el valor numérico 2. El nivel de escolaridad (primaria, secundaria, preparatoria, licenciatura y posgrado) es una variable ordinal que va de menor a mayor escolaridad, ordenada de la siguiente manera: Primaria 1 Secundaria 2 Preparatoria 3 Licenciatura 4 Posgrado 5 TABLA 2 CLASIFICACIÓN DE LA INTELIGENCIA EN ADULTOS Coeficiente intelectual Clasificación 130 o más Muy superior 120-129 Superior 110-119 Normal brillante 90-109 Normal 80-89 Subnormal 70-79 Limítrofe 50-69 Deficiente mental superficial 30-49 Deficiente mental medio 29 o menos Deficiente mental profundoSofía Rivera Aragón 22 Mirna García Méndez La satisfacción marital se medirá con el IMSM integrado por 47 enunciados positivos, con intervalos de respuesta del 1 al 5 (Cortés, Reyes, Díaz-Loving, Rivera y Monjaraz, 1994). Me gusta mucho = 5 Me gusta = 4 Ni me gusta, ni me disgusta = 3 Me disgusta = 2 Me disgusta mucho = 1 Medición 23 TABLA 3 REPRESENTACIÓN DE LOS DIFERENTES NIVELES DE MEDICIÓN Clasificación Definición Función Propiedad Estadística empleada Ejemplo Nominal Categoriza una variable. Nombra categorías. Igualdad No paramétrica. Estado civil: solteros, ca- sados, unión libre, viudos, divorciados: sexo: hombres y mujeres. Ordinal Ordena una variable. Jerarquiza las categorías > o < (mayor o menor) No paramétrica Escolaridad: primarla, se- cundarla, pre- paratoria. Intervalo Conoce la distancia entre intervalos. Cuantifica una variable. Cero Relativo. Paramétrica. Inteligencia: limítrofe, nor- mal, nomal brillante, su- perior. Razón Conoce la proporción entre las va- riables. Cuantifica una variable. Cero absoluto. Paramétrica. Las medidas de distancia: metro, decá- metro, hectó- metro y kilómetro. Por sus características, este inventario evaluará la satisfacción marital de manera intervalar, debido a que medirá las distancias o intervalos del constructo de interés. Las variables nominal (sexo) y ordinal (escolaridad) son generalmente denominadas variables sociodemográficas o de clasificación por el investigador. Ahora bien, si la satisfacción marital se mide preguntándoles a las personas si están o no satisfechas con su relación de pareja, la respuesta será dicotómica Sí o No, convirtiéndose la medición en nominal. Los resultados que se obtendrán serán frecuencias en relación con el número de hombres y mujeres que están satisfechos o insatisfechos maritalmente. Este ejemplo denota que el tipo de medición utili- zada, estará en función de los objetivos que pretenda alcanzar el investigador. De esta manera, se observa que cada una de las escalas de medición tiene características y funciones específicas, las que se presentan en la tabla 3. Estadística descriptiva La estadística descriptiva permite conocer la distribución de los datos a partir de la cuantificación de los atributos de una categoría o variable. De acuerdo con Nunnally (1995) no necesariamente incluye la generalización. Sus funciones son: a) Conocer el tipo de distribución. b) Representación gráfica. c) Obtener medidas de tendencia central (toma de decisiones). d) Calcular medidas de variabilidad. Conocer el tipo de distribución 1. Frecuencia absoluta (f) 2. Frecuencia relativa (fr %) 3. Frecuencia ajustada (fa %) 4. Frecuencia acumulada (fa) La frecuencia absoluta describe objetos, la relativa los ordena en porcentajes, la ajustada recalcula las frecuencias absolutas y relativas, eliminando datos con base en valores perdidos o missing, y la acumulada los ordena de mayor a menor o viceversa. Estas frecuencias se obtienen en el programa estadístico SPSS en cualquiera de sus versiones. Después de haber elaborado una base de datos e insertado los datos en bruto, se le pide al SPSS las frecuencias de la variable de estudio y despliega los cuatro tipos de frecuencia en una tabla. 27 Para comprender la lógica de las operaciones involucradas en la distribución de frecuencias, se expondrá un ejemplo a partir del cual se explicará la forma en la cual se obtiene cada una de las frecuencias. Ejemplo Se encuesto con un cuestionario abierto a una muestra de 300 personas, hombres y mujeres, sobre el significado del funcionamiento familiar. Una vez que se obtuvieron los datos se procedió a su organización, lo que se hizo mediante una distribución de frecuencias, tal como se observa en la tabla 4. Esta tabla muestra el total de hombres y mujeres que participaron en la investigación, sin embargo, para identificar la preferencia de hombres y mujeres por uno u otro de los significados del funcionamiento familiar, se obtuvieron las frecuencias absolutas de ocurrencia de respuesta por sexo. Estos resultados se presentan en la tabla 5. En la tabla 5 se enuncian las frecuencias absolutas (f) de ocurrencia de respuesta de la categoría de análisis sexo: hombres (H) y mujeres (M), en cada uno de los significados generales de funcionamiento familiar. En este ejemplo la muestra no tiene una distribución igual en cuanto al nú- mero de H y M incluidos, por lo que para comparar a los dos grupos aun TABLA 4 TOTAL DE HOMBRES Y MUJERES QUE OPINARON SOBRE EL SIGNIFICADO DEL FUNCIONAMIENTO FAMILIAR Sexo f Hombres 144 Mujeres 156 Total 300 Sofía Rivera Aragón Mirna García Méndez 28 TABLA 5 FRECUENCIAS DEL SIGNIFICADO DE FUNCIONAMIENTO FAMILIAR EN HOMBRES Y MUJERES Hombres Mujeres Significados generales f f Organización y estructura 25 20 Emocional-valorativa 44 66 Afectivo-funcional 53 54 Funcional 16 13 Afectiva 6 3 total 144 156 cuando existen diferencias en su tamaño se emplea la frecuencia relativa (fr %). La frecuencia relativa (fr %) se refiere a la ocurrencia de los niveles de una categoría -en este ejemplo (H y M)- por cada 100 casos. Su cálculo se obtiene al multiplicar cualquier proporción dada por 100 (Levin y Levin, 2002). Siguiendo con el ejemplo de los significados generales del funcionamiento familiar, para obtener la frecuencia relativa de los H que respondieron el cuestionario, se multiplica 100 por 144 y el resultado se divide entre 300 que es el total de personas que participaron en la investigación, y se extrae la fr que es de 48 por ciento. La tabla 6 presenta que del total de la muestra, el 48 por ciento son hombres y el 52 por ciento son mujeres. Estadística descriptiva 29 Con respecto a las respuestas de la muestra en relación con los significados del funcionamiento familiar, éstas varían tal como se observa en la tabla 5 por lo que también se aplica la frecuencia relativa al igual que en la categoría de sexo. Los datos se presentan en la tabla 7. TABLA 7 FRECUENCIAS ABSOLUTA Y RELATIVA DEL SIGNIFICADO DE FUNCIONAMIENTO FAMILIAR EN HOMBRES Y MUJERES Hombres f fr(%) Mujeres f r(%) Organización y estructura 25 17.4 20 12.8 Emocional-valorativa 44 30.6 66 42.3 Afectivo-funcional 53 36.8 54 34.6 Funcional 16 11.1 13 8.3 Afectiva 6 4.2 3 1.9 Total 144 100 156 100 La frecuencia ajustada recalcula la frecuencia absoluta quitando datos o con base en elementos perdidos que generalmente se computan con cero (en el SPSS aparecen como missing). Estos elementos perdidos se refieren a los enunciados o preguntas que la muestra no respondió. Con base en el ejemplo del significado del funcionamiento familiar en H y M, la tabla 8 presenta las frecuencias absolutas, las relativas y las ajustadas. TABLA 6 FRECUENCIAS ABSOLUTA Y RELATIVA DE LA CATEGORÍA SEXO Sexo f fr (%) Hombres 144 48.0 Mujeres 156 52.0 Total 300 100 Sofía Rivera Aragón 30 Mirna García Méndez TABLA 8 FRECUENCIAS ABSOLUTA, RELATIVA Y AJUSTADA DEL SIGNIFICADO DE FUNCIONAMIENTO FAMILIAR EN HOMBRES Y MUJERES Significados generales Hombres Mujeres f fr (%) fa (%) f fr (%) fa (%) Organización y estructura 25 17.4 17.4 20 12.8 20 Emocional-valorativa 44 30.6 30.6 66 42.3 86 Afectivo-funcional 53 36.8 36.8 54 34.6 140 Funcional 16 11.1 11.1 13 8.3 153 Afectiva 6 4.2 4.2 3 1.9 156 Total 144 100 100 156 100 En esta tabla la fr y fa (%) son iguales debido a que no hubo valores perdidos. Con fines de ejemplificar la fa (%) la tabla 9 muestra las frecuencias del estado civil de la muestra. Tabla 9 FRECUENCIAS DEL ESTADO CIVIL DE HOMBRES Y MUJERES Estado civil f fr(%) fa (%) Casado 120 40.0 40.3 Soltero151 50.3 50.7 Unión libre 13 4.3 4.4 Divorciado 8 2.7 2.7 Separado 3 1.0 1.0 Viudo 3 1.0 1.0 Total 298 99.3 100.0 Valores perdidos (missing) 0 2 .7 Total 300 100.0 Estadística descriptiva 31 La frecuencia acumulada (la) ordena los puntajes del total de casos de una categoría. Se obtiene al sumar la frecuencia de un puntaje dado a la frecuencia de la categoría debajo de ella. Al resultado de esta operación, se suma en forma acumulativa el puntaje de la categoría debajo de ella, y así sucesivamente hasta tener incluidos el total de los casos. Siguiendo el ejercicio de los significados de funcionamiento familiar, la tabla 10 presenta las frecuencias absolutas, relativas, ajustadas y acumuladas por hombres y mujeres. Ejercicio SPSS Para obtener los cuatro tipos de frecuencia en SPSS de las 300 personas, se realizan los siguientes pasos: Paso 1. En la base de datos se coloca el cursor en Analyze, se presiona el botón izquierdo del mouse. Paso 2. Al presionar Analyze, aparece un menú en el que se coloca el cursor en Descriptive Statistics, se presiona con el botón izquierdo del mouse y aparece otro menú, se coloca el cursor en Frequencies y una vez más se presiona con el botón izquierdo del mouse. TABLA 10 FRECUENCIAS ABSOLUTAS, RELATIVAS, AJUSTADAS Y ACUMULADAS DE HOMBRES Y MUJERES CON RELACIÓN AL SIGNIFICADO DEL FUNCIONAMIENTO FAMILIAR Significados generales Hombres Mujeres f fr (%) fa (%) fa f fr(%) fa (%) fa Organización y estructura 25 17.4 17.4 17.4 20 12.8 12.8 12.8 Emocional-valorativa 44 30.6 30.6 47.9 66 42.3 42.3 55.1 Afectivo-funcional 53 36.8 36.8 84.7 54 34.6 34.6 89.7 Funcional 16 11.1 11.1 95.8 13 8.3 8.3 98.1 Afectiva 6 4.2 4.2 100.0 3 1.9 1.9 100.0 total 144 100 100 156 100 100 Sofía Rivera Aragón Mirna García Méndez 32 Paso 3. Al presionar Frequencies, se abre un menú que contiene las variables de la investigación, se marca con el botón izquierdo del mouse la variable siggene (significados generales del funcionamiento familiar). Estadística descriptiva 33 Paso 4. Una vez señalada la variable siggene, se coloca el cursor en el icono que está entre las variables de estudio y variable(s), se presiona el bo- tón izquierdo del mouse, de esta operación siggene aparece en el cuadro de variable(s). Paso 5. Se coloca el cursor en el icono de OK, se presiona el botón iz- quierdo del mouse obteniéndose los cuatro tipos de frecuencias, en donde: frequency es frecuencia absoluta, percent es frecuencia relativa, valid percent es frecuencia ajustada y cumulative percent es frecuencia acumulada. Sofía Rivera Aragón 34 Mima García Méndez Estos resultados indican que los significados de funcionamiento familiar con mayor ocurrencia de respuesta fueron el emocional-valorativo y el afectivo- funcional.2 Una vez descritos los cuatro tipos de frecuencias, se proseguirá con la distribución de frecuencias agrupadas, las que se emplean para incluir las frecuencias absolutas en intervalos de clase (Levin y Levin, 2002; Downie y Heat, 1973). Estos intervalos de clase son comúnmente empleados cuando la distribución de frecuencia es tan amplia que resulta poco práctica. Es el caso del ejemplo de la tabla 11 que presenta una distribución de frecuencias por edad en una muestra de 351 personas, que varía de 21 a 60 años. La tabla 11 indica que se tiene una persona de 21 años, dos personas de 22 años, 13 personas de 23 años y así sucesivamente. Con el propósito de que los datos tengan una presentación sencilla y clara, se obtienen los intervalos de clase que para este caso es de cinco, tal como se observa en la tabla 12. La decisión del tamaño del intervalo es responsabilidad del investigador, quien generalmente parte de su base de datos y de los objetivos de su investigación. 2Con fines didácticos se presentarán las tablas del SPSS, aunque éstas no se reportan en una investigación, se abstraen los datos que el investigador desea resaltar y se muestran en otro formato. SIGNIFICADOS GENERALES Valia Cumulative Frequency Percent Percent Percent Valid organización y estructura 45 15.0 15.0 15.0 emocional-valorativa 110 36.7 36.7 51.7 afectivo-funcional 107 35.7 35.7 87.3 funcional 29 9.7 9.7 97.0 afectiva 9 3.0 3.0 100.0 Total 300 100.0 100.0 Estadística descriptiva 35 A su vez los intervalos de clase tienen un límite inferior y un límite superior (véase tabla 13). Como se observa en la tabla 13, el límite inferior del intervalo de edad 21-25 es 20.5 y su límite superior es 25.5, que también es el límite inferior del intervalo 26- 50, esto es, el límite superior de cada uno de los intervalos se convierte en el límite inferior del intervalo subsiguiente. TABLA 11 DISTRIBUCIÓN DE EDAD POR FRECUENCIAS EN HOMBRES Y MUJERES. Edad f Edad f Edad f Edad f 21 1 31 15 41 8 51 2 22 2 32 18 42 1 1 52 5 23 13 33 16 43 7 53 6 24 13 34 13 44 7 54 1 25 11 35 16 45 4 55 2 26 17 36 9 46 7 56 0 27 1 1 37 18 47 4 57 2 28 13 38 14 48 3 58 0 29 19 39 15 49 8 59 0 30 15 40 13 50 8 60 Total 4 351 TABLA 12 DISTRIBUCIÓN DE EDAD POR INTERVALOS EN HOMBRES Y MUJERES Intervalo de clase f 56-60 6 51-55 16 46-50 30 41-45 37 36-40 69 31-35 78 26-30 75 21-25 40 Total 351 Sofía Rivera Aragón Mirna García Méndez 36 Representación gráfica Los resultados que se obtienen de la investigación se pueden representar en tablas o gráficas, pero nunca se deberán emplear ambas alternativas para presentar los mismos datos; por ejemplo, si la escolaridad de la muestra se presenta en tablas, ya no se utilizará la figura, porque ello implica repetir la información. Hay investigadores que se inclinan por el uso de figuras debido a que atraen la atención visual del observador. Una de las características de las gráficas consiste en que se basan en una recta numérica (véase gráfica 1). TABLA 13 LÍMITES SUPERIOR E INFERIOR DE LOS INTERVALOS DE EDAD EN UNA MUESTRA DE 351 SUJETOS Limits inferior Intervalo de clase Límite superior 55.5 56-60 60.5 50.5 51-55 55.5 45.5 46-50 50.5 40.5 41-45 45.5 35.5 36-40 40.5 30.5 31-35 35.5 25.5 26-30 30.5 20.5 21-25 25.5 GRÁFICA 1 REPRESENTACIÓN DE LA RECTA NUMÉRICA Estadístico descriptiva 37 Las gráficas que se utilizan con mayor regularidad son: 1. Barras 2. Pastel 3. Histograma 4. Ojivas 5. Polígonos de frecuencia Las gráficas de barras y pastel se aplican únicamente a variables nominales y ordinales; mientras que los histogramas, ojivas y polígonos de frecuencia se emplean en variables ordinales, intervalares y de razón. Gráfica de barra En esta figura no hay continuidad en las barras cuando se emplea en datos nominales, razón por la que están separadas. La gráfica 2 muestra el grado de escolaridad de los 300 sujetos a los que se les aplicó el cuestionario abierto del significado de funcionamiento familiar. Los números que aparecen al interior de cada una de las barras son opcionales, se incluyen si el investigador quiere indicar el número de sujetos que corresponde a cada nivel educativo. Así el número 22 que aparece en la barra de primaria, indica que de la muestra total de 300 personas, 22 de ellas tienen educación primaria. La gráfica 3 presenta las cinco categorías que resultaron de la aplicación del cuestionario abierto del significado de funcionamiento familiar (organización y estructura, emocional-valorativa, afectivo-funcional, funcional y afectiva) así como la distribución de la muestra en cada categoría. La diferencia entre las gráficas 2 y 3, es que en la gráfica 2 cada barra muestra el número exacto de sujetos ubicados en cada grado escolar, mientras que en la gráfica 3 se observa de manera general la distribución de la muestra en las cinco categorías de funcionamiento familiar.La elección de una u otra figura está en función de lo que el investigador quiera resaltar de sus resultados. Sofía Rivera Aragón Mirna García Méndez 38 GRÁFICA 2 NIVEL DE ESCOLARIDAD GRÁFICA 3 DISTRIBUCIÓN DE LA MUESTRA EN LAS CATEGORÍAS DE FUNCIONAMIENTO FAMILIAR Estadística descriptiva 39 Gráfica de pastel o de sectores Se utiliza con frecuencias absolutas y relativas, es útil para mostrar di- ferencias de frecuencias en categorías de nivel nominal. La gráfica 4 presenta la variable ocupación de una muestra de 352 personas, hombres y mujeres del Distrito Federal. Gráfica 4 OCUPACIÓN DE HOMBRES Y MUJERES Cada sección de la gráfica tiene el número de individuos agrupados por cada uno de los cinco tipos de ocupación. También con la figura de pastel se puede presentar la distribución de la muestra con porcentajes, como se aprecia en la gráfica 5. Del total de las 352 personas que integran la muestra, su escolaridad se distribuye de la siguiente manera: 18 por ciento tiene primaria, 36 por ciento secundaria, 31 por ciento preparatoria y 25 por ciento licenciatura. Gráfica de histograma Se emplean en variables continuas3 y se elaboran con base en el límite inferior del intervalo. La gráfica 6 muestra los intervalos de edad de la 3 Una variable continua es aquella que asume un conjunto ordenado de valores dentro de un rango (Kerlinger y Lee, 2001). Sofía Rivera Aragón 40 Mirna García Méndez GRÁFICA 5 NIVELES DE ESCOLARIDAD EN HOMBRES Y MUJERES muestra de 351 sujetos de las tablas 12 y 13. Las barras están unidas por- que denotan continuidad del intervalo de menor edad (21-25) al de mayor edad (56-60). GRÁFICA 6 INTERVALOS DE EDAD EN UNA MUESTRA DE 351 HOMBRES Y MUJERES Estadística descriptiva 41 Otro ejemplo relacionado con los histogramas es el caso del cons- tructed esperanza, medida por una escala cuyos intervalos de respuesta van del 1 al 5. Esta escala se constituye por dos dimensiones: importancia y probabilidad, cada una con 10 factores (Vargas, García-Méndez, Díaz- Loving y Rivera, 2004). El histograma de la figura 7 muestra el com- portamiento de uno de los factores de probabilidad -ayuda paterna- en una muestra de 300 personas del D.E GRÁFICA 7 NÚMERO DE PERSONAS POR INTERVALO DE RESPUESTA EN EL FACTOR DE AYUDA PATERNA EN LA ESCALA DE ESPERANZA Gráfica de ojiva o de polígono de frecuencia acumulada Se basa en la frecuencia absoluta y se grafica con el límite superior. En esta figura, la línea que conecta los puntos es ascendente, razón por la que no toca la línea base horizontal (Downie y Heath, 1973). La gráfica 8 presenta los rangos de edad de una muestra de 351 personas, rangos distribuidos con base en el límite superior presentado en la tabla 13 de este capítulo. Sofía Rivera Aragón 42 Mirna García Méndez GRÁFICA 8 RANGOS DE EDAD Gráfica de polígonos de frecuencia Se conoce también como curva. Es más fácil de graficar después de hacer un histograma. Un ejemplo de polígonos de frecuencia se expone en la gráfica 9, en una muestra de 168 parejas heterosexuales, cuyos años de unión se distribuyeron por rangos. Gráfica 9 RANGOS AÑOS DE UNIÓN Estadística descriptiva 43 Obtener medidas de tendencia central Es común en el ámbito de la investigación, querer saber lo típico o el promedio en el que se encuentra la muestra de estudio, con la finalidad de describirla en forma global. Este promedio o valor se conoce como medida de tendencia central debido a que se encuentra en el centro de una distribución en la que se localizan la mayoría de los puntajes de la muestra (Levin y Levin, 2002). La forma de obtener este promedio es a través de las medidas de tendencia central: media, mediana y moda expuestas en la tabla 14. 1. Media → es un promedio. 2. Mediana → divide en dos a la muestra. 3. Moda → es el valor que se repite con mayor frecuencia. Tabla 14 MEDIDAS DE TENDENCIA CENTRAL Representación Nivel de medición Exactitud Paramétrica No paramétrica X μ (media) Intervalar Md (mediana) Ordinal Mo (moda) Nominal Exacta Variable Inestable Como se observa en la tabla 14 es usual emplear letras latinas para re- presentar las características de una muestra y las letras griegas para los parámetros de una población (Downie y Heath, 1973). En el caso de la tabla 14, la X(media) es un estimador debido a que es un valor que representa una característica de la muestra, y la μ (media) es un parámetro, porque es un valor que representa las características de una población. Estas medidas de tendencia central son empleadas en la toma de decisiones e indican el punto medio de una distribución, tal como se observa en la gráfica 10. 44 Sofía Rivera Aragón Mirna García Méndez GRÁFICA 10 DISTRIBUCIÓN NORMAL Media La media aritmética X es la medida de tendencia central más utilizada en la investigación, se obtiene al sumar el total de puntajes obtenido por la muestra, dividido entre el número total de la muestra (Clark-Carter, 1997; Levin y Levin, 2002; Downie y Heath, 1973). Su fórmula es: Estadística descriptiva 45 La media. La suma expresada por la letra griega sigma Datos crudos Número de casos Donde: Esta fórmula se emplea en datos no agrupados (datos crudos) en muestras pequeñas. Ejemplo 1 Conocer la media de edad de una muestra de diez sujetos Cuando se trabaja con datos agrupados por frecuencias o por intervalos y con muestras grandes, la media se obtiene con la siguiente fórmula: La media. La suma expresada por la letra griega sigma Los puntajes en crudo de la muestra Un puntaje multiplicado por su frecuencia de ocurrencia La suma de los fx Número de casos Sofía Rivera Aragón Mirna García Méndez 46 donde: Ejemplo 2 Se aplicó a una muestra de 330 hombres y mujeres la escala de depresión de Zung (1965) (SDS).4 La presencia o ausencia de depresión se evaluó con base en cuatro niveles: 1 = < 50% sin depresión 2 = > 50% depresión leve 3 = > 60% depresión moderada 4 = > 70% depresión grave Primero se obtienen las frecuencias de ocurrencia en cada uno de los niveles de depresión. Niveles de depresión f 1 264 2 45 3 14 4 7 Después se obtiene la fx, al multiplicar cada una de las frecuencias por el nivel de depresión correspondiente. 4SDS son las siglas del nombre de la escala en inglés: Self-Rating Depression Scale. Estadística descriptiva 47 Esta media de 1.3 indica que la mayoría de los 330 sujetos se ubican en el nivel 1, lo que significa que en promedio la muestra no tiene depresión. Ejemplo 3 Para obtener la media de años de unión de una muestra de 352 sujetos que vivían con una pareja al momento de la investigación, los datos se agruparon en intervalos. Una vez derivados los intervalos, se obtiene la marca de clase (Mx) o punto medio de cada intervalo donde 33 es el, punto medio del intervalo 31-35 porque 33 + 2 = 35 y 33- 2 = 31. Intervalo Mx 31-35 33 26-30 28 21-25 23 16-20 18 11-15 13 6-10 8 1-5 3 Enseguida se obtiene la frecuencia de ocurrencia (f) de cada intervalo, así en el intervalo de 26-30 años de unión, se encuentran 24 personas. Intervalo Mx f 31-35 33 8 26-30 28 24 21-25 23 34 16-20 18 49 11-15 13 84 6-10 8 110 1-5 3 43 Sofía Rivera Aragón Mirna García Méndez 48 Posteriormente se multiplica cada frecuencia por su respectiva Mx y se consiguen de esta manera las fx. De esta manera se concluye que la media deaños de unión de esta muestra es de 13.3. Mediana La mediana (Md) es el valor medio de la distribución, divide el total de los casos en dos, razón por la que se dice que divide en dos a la muestra, dejando el mismo número de casos a cada lado de ella (Downie y Heath, 1973). Cuando se tiene un número impar de casos, la Md se ubica exactamente a la mitad de la distribución. En los datos que a continuación se presentan, la Md de edad de los 145 sujetos es de 21 años y le quedan tres rangos de edad hacia arriba y tres rangos de edad hacia abajo. Edad f 18 21 19 22 20 32 21 26 22 14 23 18 24 12 n = 145 Estadística descriptiva 49 Una vez obtenida la fa se localiza la posición de la Md 73 en la columna de la fa. El número más cercano al 73 es el 70 por lo que la Md de edad es 21. Si el número de casos es par, entonces se procede de acuerdo con el siguiente ejemplo. En una muestra de 90 sujetos, la posición de la Md 45.5 se ubica entre las fa 35-50 por lo que la Md es de 10.5 años de escolaridad, situada a la mitad de la distribución. Moda La moda (Mo) es una medida de tendencia central para datos no agru- pados, cuyo valor se presenta más veces. En el ejemplo anterior la Mo es Edad f fa 18 21 145 19 22 124 20 32 102 21 26 70 22 14 44 23 18 30 24 12 12 n= 145 De acuerdo con Levin y Levin (2002) la posición del valor de la Md también se puede obtener con la fórmula: Posición de la Md Siguiendo con el ejemplo de la edad: Posición de la Md Para localizar el número 73 se saca la frecuencia acumulada (fa) la cual se revisó al inicio de este capítulo. Sofía Rivera Aragón Mirna García Méndez 50 10 años de escolaridad, debido a que su frecuencia es la más alta en la distribución: son 15 los sujetos que tienen estos años de escolaridad. Ejercicio SPSS Para obtener las medidas de tendencia central en SPSS, se retomará el ejercicio de los significados generales del funcionamiento familiar desarrollado para extraer los cuatro tipos de frecuencias. Recuerde que después de realizar los pasos 1, 2, 3 y 4 en el SPSS se obtuvo un menú. En este menú, ahora se coloca el cursor en el icono de statistics y se presiona el botón izquierdo del mouse: Estadística descriptiva 51 Al presionar statistics aparece un menú en el que se coloca el cursor en cada uno de los cuadros de las tres medidas de tendencia central de nuestro interés - media, mediana y moda— se presiona en estos cuadros con el botón izquierdo del mouse, enseguida se coloca el cursor en el ícono de continue que se presiona con el botón izquierdo del mouse. Al presionar el icono de continue reaparece el menú del paso 4 y se presiona el icono OK. Sofía Rivera Aragón 52 Mirna García Méndez Después de presionado el icono de OK aparecen en una tabla las medidas de tendencia central con sus respectivos valores. El valor de la media, mediana y moda es de 2, lo que indica una distribución normal de las respuestas de la muestra. Calcular medidas de dispersión (variabilidad) Las medidas de dispersión son importantes en la descripción de la dis- tribución, debido a que indican el grado en que varían los datos con relación a la parte central de la curva normal, lo que las convierte en un elemento inseparable de las medidas de tendencia central; además estas medidas de dispersión sólo pueden aplicarse a medidas de rango e intervalares. Las más empleadas son: 1. Rango 2. Desviación estándar 3. Varianza 4. Sesgo 5. Curtosis 6. Error estándar Rango (R) El rango también conocido como recorrido (Mendenhall, 1982; Downie y Heath, 1973) es la distancia entre el valor mínimo y el valor máximo de Estadística descriptiva 53 STATISTICS Significados generales N Valid 300 Missing 0 Mean 2.4900 Median 2.0000 Mode 2.00 una distribución. Su cálculo es fácil y rápido, no requiere de fórmula y se puede utilizar en medidas ordinales e intervalares. Su desventaja radica en su inestabilidad, esto es, de una muestra a otra, presenta grandes variaciones, por lo que se recomienda emplearse como una medida preliminar. Un ejemplo de esta medida de variabilidad es conocer el rango de rendimiento escolar de 42 alumnos, cuya calificación más alta fue de 9 y la más baja de 2. El R se obtiene de la resta 9-2 esto es el R = 7. Desviación estándar (o = parámetro de la población) (s = estimador de la muestra) La desviación estándar únicamente se puede emplear en medidas intervalares. Es una puntuación que indica la distancia con relación a la media, razón por la que la media no tiene significado sin la desviación. De esta forma, como se observa en la gráfica 11, la desviación representa la variabilidad promedio de una distribución. GRÁFICA 11 REPRESENTACIÓN DE LA DESVIACIÓN ESTÁNDAR EN UNA DISTRIBUCIÓN NORMAL Sofía Rivera Aragón 54 Mirna García Méndez Para entender la desviación estándar de la cual depende la significancia, es necesaria la curva (véase gráfica 12) que representa el 100 por ciento de la probabilidad. De esta manera, 100 por ciento es el área bajo la curva. GRÁFICA 12 REPRESENTACIÓN DE LA SIGNIFICANCIA A PARTIR DE LA DESVIACIÓN ESTÁNDAR EN UNA DISTRIBUCIÓN NORMAL Estadística descriptiva 54 Suma de frecuencias de puntajes crudos elevados al cuadrado n = Número total de casos (X)2 = Media elevada al cuadrado s = Desviación estándar donde: Su fórmula es: Ejemplo Para calcular la desviación estándar del número de hijos en una muestra de 176 parejas, se realiza lo siguiente: 1. Se obtiene la distribución de frecuencia (/) Núm. de hijos (x) f 1 49 2 74 3 34 4 15 5 4 n = 176 2. Se multiplica cada frecuencia por el número de hijos, esto es, 49 parejas tienen un hijo, se multiplica 49 X 1; 74 parejas tienen dos hijos, se multiplica 74 X 2, y así sucesivamente. Núm. de hijos (x) f fx 1 49 49 2 74 148 3 34 102 4 15 60 5 4 20 n = 176 S/x = 379 3. Se multiplica cada fx por el número de hijos y así se obtienen las fx2. Núm. de hijos (x) fx fx2 1 49 49 2 148 296 3 102 306 4 60 240 5 20 100 2/x2 = 991 Sofía Rivera Aragón Mirna García Méndez 56 Varianza (s2 o σ2) La varianza es la desviación estándar al cuadrado, indica una distancia con respecto a la X, su aplicación es el análisis de varianza (Anova)5 e indica cuánto de la variabilidad de la variable dependiente es explicada por la variable independiente. De esta forma muestra qué tanto de la variabilidad de la variable dependiente es explicada por las diferencias de los individuos, proceso al que se le conoce como varianza de error. 5 Siglas en inglés del análisis de varianza. Estadística descriptiva 57 De acuerdo con la fórmula de la desviación estándar se toma del punto dos. falta obtener la media por lo que 4. Una vez que se tiene la X = 2.15 hijos, ésta se eleva al cuadrado (X)2 — 4.62 y entonces: Sesgo El sesgo se refiere a la variación de una distribución, es el grado de asimetría de la distribución observada por el número de casos agrupados en una sola dirección. Su interpretación está asociada con el valor y el signo, esto es: Valor - 4 a + 4 Signo + - El signo implica el nivel de asimetría de la curva, cuando más cercana está al cero, la curva es normal, cuando más cercana está al cuatro, la curva es asimétrica o sesgada. Ejemplos Una muestra de 60 mujeres se clasificó por la actividad que realizaban de la siguiente manera: 1. estudiantes, 2. empleadas, y 3. sin actividad. En la gráfica 13 se puede ver que la mayoría de la muestra era estudiante, lo que se refleja en el sesgo positivo de la gráfica 13. GRÁFICA 13 ACTIVIDADES REALIZADAS POR MUJERES Sofía Rivera Aragón 58 Mirna García Méndez Al indagar en torno a los elementos que intervienen en el funcionamientofamiliar en una muestra de 300 sujetos, se encontró que 232 reportaron que la comunicación es un indicador que interviene en el funcionamiento familiar. Estos hallazgos se observan en la gráfica 14 que muestra un sesgo negativo debido a que la curva está cargada a la derecha. GRÁFICA 14 LA COMUNICACIÓN COMO ELEMENTO DEL FUNCIONAMIENTO FAMILIAR Curtosis (K) Es el nivel de picudez de una curva, esto es, su grado de elevación o aplanamiento. A diferencia del sesgo, la curtosis es una z4 sobre el número de sujetos. Estadística descriptiva 59 La curtosis al igual que el sesgo depende del valor y del signo: a) Valor. Si el cero va de + 4 a - 4 la curva es mesocúrtica. b) Signo. Si es positivo se habla de una curva leptocúrtica. Ejemplos El número de hijos en una muestra de 176 parejas fluctuó entre uno y cinco, predominando las parejas con dos hijos, tal como se observa en la gráfica 15, lo que hace que la curva sea alta o picuda (leptocúrtica). GRÁFICA 15 NÚMERO DE HIJOS La gráfica 16, representa una curva mesocúrtica, esto es, una distribución normal en una muestra de 60 mujeres, 30 con diagnóstico que indica problemas de alimentación y 30 sin problemas alimenticios. La gráfica 17, muestra una curva platocúrtica hipotética, que se caracteriza por su distribución relativamente plana. De esta manera se observa que el sesgo y la curtosis indican la asimetría, el sesgo hacia uno u otro lado de la curva y la curtosis a través de la elevación de la misma. Sofía Rivera Aragón 60 Mirna García Méndez Error estándar (σ o e) El error estándar es la diferencia entre la media muestral y la media poblacional, está vinculado al error de muestreo. GRÁFICA 16 DIAGNÓSTICO DE PROBLEMAS EN LA ALIMENTACIÓN GRÁFICA 17 CURVA PLATOCÚRTICA Estadística descriptiva 61 Ejercicio SPSS Para obtener las medidas de dispersión en SPSS de una muestra de 300 personas a las que se les aplicó la escala de depresión de Zung (1965) se llevan a cabo los siguientes pasos: Paso 1. En la base de datos se coloca el cursor en analyze, se presiona el botón izquierdo del mouse, aparece un menú en el que se coloca el cursor en descriptive statistics y se presiona el botón izquierdo del mouse, nuevamente se muestra un menú en el que se presiona con el botón izquierdo del mouse, frequencies. Paso 2. Al presionar frequencies, se abre un menú que contiene las variables de la investigación, se marca con el botón izquierdo del mouse la variable rangos (niveles de depresión). Paso 3. Una vez señalada la variable rangos, se coloca el cursor en el icono que está entre las variables de estudio y variable(s), se presiona el botón izquierdo del mouse, lo que resulta en que rangos aparece en el cuadro de variable(s). Posteriormente se coloca el cursor en el icono de statistics y se presiona el botón izquierdo del mouse. Sofía Rivera Aragón 62 Mirna García Méndez Paso 4. Al presionar el icono de statistics aparece un menú en el que se colocará el cursor en cada uno de los cuadros de las tres medidas de dispersión -desviación estándar, varianza y rango- para después presio- nar en cada cuadro con el botón izquierdo del mouse. De igual forma se Paso 3 Estadística descriptiva 63 Paso 5. Después de presionar las medidas de dispersión y la curtosis, se coloca el cursor en el icono de continue y se presiona con el botón izquierdo del mouse, de lo que resulta el menú del paso tres. En el menú del paso tres, se coloca el cursor en el icono de OK, se presiona el botón izquierdo del mouse y aparecen las medidas de dispersión y la curtosis con sus respectivos valores. coloca el cursor en el cuadro de kurtosis y se presiona el botón izquierdo del mouse. STATISTICS Rangos N Valid Missing 330 22 Std. Deviation .6458 Variance .4171 Kurtosis 6.138 Std Error of Kurtosis .268 Range 3.00 Sofía Rivera Aragón Mirna García Méndez 64 Los valores de la tabla del SPSS indican que de los 330 casos analizados, 22 quedaron fuera debido a que dejaron sin contestar varios de los reactivos que incluye la escala. Los valores de la desviación estándar y la varianza indican una distribución normal, la curtosis muestra que la mayoría de las personas se ubica en uno de los cuatro rangos de depresión, y el rango señala que de los cuatro intervalos de respuesta de la escala, el 3 fue el que obtuvo mayor frecuencia. Como parte final de este capítulo, la tabla 15 presenta las pruebas de la estadística descriptiva y los tipos de gráficas asociadas con el nivel de medición revisados en el capítulo uno. Estadística descriptiva 65 TABLA 15 ESTADÍSTICA DESCRIPTIVA Medidas de Gráficas tendencia central Medidas de dispersión Correlación Nominal Barras Pastel Moda No hay Coeficiente Phl C de contingencia V de Cramer Ordinal Barras Pastel Moda Mediana No hay Tau b de Kendall Tau c de Kendall Gamma de KrusKal y Godman Spearman Incertldumbre Intervalar Ojiva Polígonos de frecuencia Histograma Moda Mediana Media 1. Rango 2. Error 3. Desviación 4. Varianza 5. Sesgo 6. Curtosis Eta Pearson Estadística inferencial La estadística inferencial se basa en la prueba de hipótesis, se define como un conjunto de técnicas que permiten al investigador obtener conclusiones a partir de una muestra para después ser generalizadas a una población. De este modo, su principal función es la generalización en una población (parámetros) habitualmente en términos de probabilidad (Nunnally y Bernstein, 1995) a partir de las conclusiones obtenidas, resultado de la manipulación de variables en muestras observadas. Aplicaciones de la estadística inferencial a) Comparar parámetros. Un parámetro es cualquier característica de una población. b) Aplicar pruebas de hipótesis. Hipótesis conceptual Deriva del marco teórico, parte de una teoría, un modelo teórico o un metanálisis. Son hipótesis que ya fueron planteadas por otro investigador. Ejemplo A mayor frustración mayor agresión (Dollar, Doob, Miller, Mowrer y Sears, 1939). Hipótesis de trabajo Estas hipótesis se refieren a lo que espera encontrar el investigador a partir de un marco teórico. 69 Ejemplo Existe relación entre el aprovechamiento escolar y la autoestima. Hipótesis estadísticas Se clasifican en nulas y alternas, presentan las siguientes características: 1. implican la relación entre variables, y 2. se plantean sólo cuando se aplica estadística en la investigación (véase tabla 16). Un punto importante de señalar es que en los estudios exploratorios no se deberán proponer ninguna de estas hipótesis (nulas y alternas). TABLA 16 HIPÓTESIS ESTADÍSTICAS Tipo Notación Definición Formas Función Nula Ho Niega la relación o diferencia entre variables a) Comparación b) Relación Diferencias entre grupos Asociación entre variables Alterna H1 Presencia de la relación o la diferencia a) Comparación b) Relación I. Con dirección. Indica que uno de los parámetros es más bajo o más alto que otro. II. Sin dirección. Sólo compara grupos. II. Con dirección. Indica que las variables aumen- tan o disminuyen. II. Sin dirección. Sólo establece relaciones. Sofía Rivera Aragón Mirna García Méndez 70 Ho de relación V1 = Agresión (X) v2 = Niveles de testosterona (Y) Ho = No existe relación entre agresión y el nivel de testosterona en hombres. Con notación estadística Ho: rxy = 0 H1 de comparación sin dirección. Utiliza los dos lados de la curva. Estadística inferencial 71 Ejemplos Ho de comparación Se identifica la variable dependiente (VD) y la independiente (VI) o de clasificación (VE). VD = Asertividad vc = Sexo: hombres y mujeres Ho = No existen diferencias estadísticamente significativas en la asertividad entre hombres y mujeres. Con notación estadísticaVD = Calidad de vida vc = Estado civil: casados y solteros H1 = Sí hay diferencias estadísticamente significativas en la calidad de vida entre solteros y casados. Con notación estadística Los solteros tienen mayor calidad de vida que los casados. Con notación estadística Sofía Rivera Aragón Mirna García Méndez 72 H1 de comparación con dirección. Se ocupa de un solo lado de la curva H1 de relación sin dirección V1 = identidad nacional (X) V2 - Edad (Y) H1 = Existe relación entre la identidad nacional y la edad en los uni- versitarios. Con notación estadística H1 = rxy ≠ 0 H1 de relación con dirección H1 = a mayor identidad nacional mayor edad en los universitarios Con notación estadística H1 = rxy > + 0 H1 = a mayor identidad nacional menor edad en los universitarios Con notación estadística H1 = rxy > - 0 Clasificación de la estadística inferencial No paramétrico Es una estadística de distribución libre, se basa en frecuencias, porcentajes y rangos, estos últimos basados en rangos de ordenación los cuales son buenas medidas de variabilidad para muestras pequeñas, no así para muestras grandes. Las pruebas de la estadística no para- métrica se enfocan en las diferencias entre las medianas y parten de un modelo que especifica únicamente condiciones muy generales en torno a la distribución de la cual fue obtenida la muestra (Siegel y Castellan, 2003). Estadística inferencial 73 Ventajas a) Se puede aplicar a muestras pequeñas en las que la n > 4. b) Sus niveles de medición son nominal y ordinal. En el nivel nominal se pueden tratar datos que impliquen clasificación (sexo: hombre o mujer). En el nivel de medición ordinal, el investigador concluye que algunos sujetos de investigación tienen más o menos del atributo medido, sin determinar qué tanto más o qué tanto menos. c) Si se aplica a variables intervalares, éstas deberán ser convertidas en categorías. Por ejemplo: d) Está libre de parámetros. Se refiere a que su distribución es libre. Desventajas Cuando se aplica a variables intervalares sin ser convertidas en categorías, se infla el valor de la prueba y se comete el error estadístico conocido como error tipo 1 o alfa que consiste en rechazar la Ho cuando es verdadera, situación que conduce a conclusiones falsas. Dadas las características de la estadística no paramétrica, existe una diversidad de pruebas que pueden ser empleadas con base en los requisitos citados. En la tabla 17 se presentan las pruebas no paramétricas más utilizadas, así como una serie de elementos que facilitan la toma de decisiones con relación a las condiciones que se deben cubrir para emplear una u otra prueba. Sofía Rivera Aragón Mirna García Méndez 74 TABLA 17 PRUEBAS DE LA ESTADÍSTICA NO PARAMÉTRICA Prueba Objetivo Nivel de medición Diseño Muestreo Instrumentos X2 Bondad de ajuste Conocer la distribución de la muestra Nominal y ordinal De una muestra No probabi- lísticos Cuestionarios: abiertos cerrados Jerarquización observaciones Por homo- geneidad Conocer si existen dife- rencias entre dos o más gru- pos Nominal y ordinal De dos o más muestras inde- pendientes Indepen- dencia Conocer si existe relación entre dos o más variables Nominal y ordinal De una muestra Corrección de Yates Conocer dife- rencias o aso- ciación entre variables en muestras pe- queñas Nominal y ordinal De una muestra o de dos muestras independientes McNemar Comparar si existen dife- rencias antes y después de un evento Nominal y ordinal Pretest-postest Antes-después Una sola muestra medida dos veces No proba- bilístico Cuestionarios: abiertos cerrados jerarquización observaciones T de Wilcoxon Comparar si existen dife- rencias antes y después de un evento Ordinal Pretest-postest Antes-después Una sola muestra medida dos veces No proba- bilístico Los mismos que en X2 y McNemar U de Mann Whitney Comparar si existen dife- rencias entre dos grupos Ordinal Dos muestras in- depend ¡entes No proba- bilístico Los mismos que en las pruebas a n t e r i o r e s , además de escalas Análisis de varlanza de KrusKall Wa- llis Comparar si existen dife- rencias entre tres o más gru- pos Ordinal Más de dos muestras inde- pendientes Probabilís- tico Escalas Estadística Inferencial 75 Paramétrica La estadística inferencial paramétrica se sustenta en supuestos o parámetros y para poder emplearla es necesario cubrir los siguientes principios: 1. Distribución normal. Indica que los grupos tienen una curva normal o mesocúrtica (esta curva se describe en el capítulo 2, figura 8). Con esta afirmación se asume que las muestras (n) con las que se está trabajando se han extraído de TABLA 17 (Continuación) Prueba Objetivo Nivel de medición Diseño Muestreo Instrumentos Análisis de varianza de Friedman C o m p a r a r tres o más mediciones en un grupo Ordinal De medidas r e p e t i d a s Tres o más muestras re- lacionadas No proba- bilístico Probabilís- tico Escalas Spearman rho (rs) coeficiente de asociación Conocer re- laciones entre dos variables Ordinal De una sola muestra No proba- bilístico Probabllís- tico Escalas Phi Coeficiente de asociación Conocer re- laciones entre dos variables N o m i n a l . Se aplica a tablas de contingencia de 2x2 (tablas pequeñas) De una sola muestra No proba- bilístico en m u e s t r a s grandes Pruebas* com- paradas que se aplican en C de con- tingencia Conocer re- laciones entre dos variables N o m i n a l . Se aplica a tablas de contingencia mayores de 2x2 (tablas me- dianas) De una sola muestra No proba- bilístico Pruebas com- paradas que se aplican en X2 V de Cramer Conocer re- laciones entre dos variables N o m i n a l . Corrección a la C de contingencia De una sola muestra No proba- bilístico Cuestionarios: abiertos cerrados jerarquización observaciones *La prueba Phi y la C de contingencia dependen de la X2. Sofía Rivera Aragón Mirna O a roía Méndez 76 poblaciones normalmente distribuidas, si no es éste el caso, se dice que las pruebas estadísticas que dependen del principio do normalidad están viciadas, razón por la que las conclusiones obtenidas a partir de las observaciones de estas muestras estarán en tela de juicio. 2. Homecedasticidad de varianza u homogeneidad de varianza. La distancia entre la calificación de un grupo y los de otro grupo deben ser iguales, esto es, la distancia de las X a todas las puntuaciones individuales. Este principio supone que las varianzas dentro de los grupos son es- tadísticamente las mismas, o sea, que las varianzas son homogéneas de un grupo a otro (Kerlinger y Lee, 2001). Esta situación puede provocar el error estadístico tipo 2 o beta, que consiste en aceptar la Ho cuando es falsa. 3. Selección y asignación aleatoria. Sólo se aplican muestreos probabilísticos entendidos como la técnica en la cual todos los sujetos tienen la misma probabilidad de ser elegidos. También en la estadística paramétrica se utiliza el muestreo no probabilístico, definido como aquel en el que las personas no tienen la misma probabilidad de ser elegidos. Sin embargo, al emplear alguna de las técnicas de muestreo no probabilístico es conveniente replicar los estudios. De acuerdo con Kerlinger y Lee (2001) el muestreo probabilístico no es necesariamente superior al no probabilístico en todas las situaciones. Refieren que en el primero el énfasis está en el método y la teoría que lo sustenta, mientras que en el segundo, el énfasis se encuentra en la persona que hace el muestreo. Puesto que no es el propósito de este apartado profundizar en las técnicas de muestreo, en la tabla 18 se mencionan algunas de ellas. 4. La variable dependiente debe ser medida a nivelintervalar. Esto significa que las medidas deberán ser continuas con intervalos iguales, ejemplo, las escalas tipo Likert de estilos y estrategias de poder (Rivera y Díaz-Loving, 2001) y el inventario multifacético de satisfacción marital (Cañetas, 2000). Ambas son pruebas con cinco intervalos de respuesta. Estadística inferencial 77 La tabla 19 muestra las pruebas paramétricas más empleadas por el investigador social, además de los criterios que se deben tomar en cuanta para emplear una u otra prueba. La revisión en detalle de algunas de estas pruebas se expondrá en el capítulo 5 de este texto. TABLA 18 TÉCNICAS DE MUESTREO Técnicas de muestreo probabilístico Técnicas de muestreo no probabilístico Aleatorio simple Accidental Aleatorio con reemplazo Intencional Estratificado Por cuota Por conglomerado Estratificado TABLA 19 PRUEBAS DE LA ESTADÍSTICA PARAMÉTRICA* Prueba Objetivo Nivel de medición Diseño Muestreo Instrumentos Coeficiente P r o d u c t o - m o m e n t o de Pearson Relacionar dos variables Intervalar De una sola muestra C o r r e l a c i o - nal bivariado Proba bilis- tico: M u e s t r a grande Escalas Prueba t de student Discrimina- ción de reactivos VD a nivel I n t e r v a l a r De dos muestras independientes Probabilís- tico: M u e s t r a p e q ue ñ a n < 3 0 Escalas Comparar dos grupos VI {Nominal VC {y VE {Ordinal De dos muestras independientes Comparar dos condiciones o mediciones Prueba post hoc del Anova Dos muestras relacionadas pretest-pos- test Antes-después M u e s t r a grande n > 30 Sofía Rivera Aragón Mirna García Méndez 78 Prueba Objetivo Nivel de medición Diseño Muestreo Instrumentos Anova (análisis de varianza) a) simple de una vía Compara tres o más grupos La VD debe ser in-ervalar Tres o más muestras in- dependientes Probabilisti- co: Muestra grande Escalas b) factorial de dos vías Comparar dos o más variables Independientes con tres o más categorías vi {Nominal vc {y ve {Ordinal Factoriales Muestra grande 15 sujetos míni- mo por cel- dilla *VC se refiere a las variables de clasificación y VE a las variables de estímulo. Pruebas de la estadística no paramétrica Cuando existe duda respecto a la normalidad de la población o cuando la población no es normal es conveniente emplear una prueba no paramétrica, que como ya se mencionó en el capítulo 3 no parten del principio de normalidad. Asimismo, las pruebas no paramétricas se clasifican en tres grupos: para una muestra simple, para muestras relacionadas y para muestras independientes. Debido a la amplia variedad de pruebas en cada uno de estos grupos, en este capítulo sólo se describirán las de mayor uso en la investigación en psicología. Pruebas para una muestra simple Generalmente las pruebas para una muestra simple son pruebas de bondad de ajuste que tienen como objetivo conocer la distribución de la muestra. Chi cuadrada (X2) La chi cuadrada es la prueba más empleada en la investigación en psicología. Esta prueba se aplica para comparar las frecuencias esperadas (poblacionales) y las frecuencias obtenidas (muestra) y a partir de esta comparación decidir si existen diferencias significativas. Las frecuencias esperadas se refieren a la hipótesis nula (Ho) y las frecuencias obtenidas son los resultados alcanzados por el investigador. De este modo, mientras mayor sea el valor de X2 menor es la probabilidad de que las frecuencias obtenidas se deban a la población, esto 83 La fórmula para obtener las fe es fe= N /k donde: N = número de personas. k = número de categorías o columnas. De esta manera, el procedimiento para obtener la X2 consiste en restar cada frecuencia esperada de su correspondiente frecuencia obtenida, la diferencia de esta resta, se eleva al cuadrado y se divide entre la frecuencia esperada, estos resultados parciales se suman y se obtiene el valor de la chi cuadrada. Una vez que se obtiene el valor de la chi cuadrada, se requiere conocer los grados de libertad (gl) que se definen como la amplitud de variación contenida en una condición de investigación, lo que significa la posibilidad de variación (Kerlinger y Lee, 2001; Downie y Heath, 1973). Asimismo, junto con los grados de libertad, se requiere de una tabla de valores de X2 para conocer de acuerdo con los gl y al valor de la X2, si ésta es o no significativa. Sofía Rivera Aragón Mirna García Méndez 84 significa que el valor de chi cuadrada es significativo si la diferencia entre las frecuencias esperadas y las frecuencias obtenidas es lo suficientemente grande (Siegel y Castellan, 2003; Levin y Levin, 2002). Su fórmula es: suma de todas las casillas, de la primera a la última. frecuencia obtenida, frecuencia esperada. donde: La fórmula para obtener los grados de libertad es: gl = k - 1 donde: k = número de columnas de la tabla de contingencia También la X2 se utiliza en muestras independientes, en este caso se le conoce como prueba de homogeneidad y su objetivo es conocer si existen diferencias entre dos o más grupos. Un tercer uso de esta prueba, es como prueba de independencia, aquí su objetivo es conocer si existen relaciones entre dos o más variables en una muestra. Un cuarto uso es como prueba de corrección por continuidad de Yates, la cual le da mayor precisión a la X2 cuando tiene fe pequeñas. En los tres primeros casos -bondad de ajuste, homogeneidad, independencia- la chi cuadrada se obtiene con la misma fórmula. Reglas para su empleo 1. Las observaciones deben ser independientes, no se puede observar o medir a la misma persona más de una vez. 2. El nivel de medición utilizado será nominal u ordinal. 3. Se aplicará en muestreos no probabilísticos. 4. La muestra deberá ser mayor a 20 {N > 20). 5. Si la muestra N < 20 entonces se utiliza la prueba de probabilidad exacta de Fisher. 6. Las frecuencias esperadas deben ser mayores a 5. 7. Si la frecuencia esperada es > 5 y < 10, entonces se aplica la corrección por continuidad de Yates. 8. Si la N > 20 y < 40, se aplica la prueba de corrección por continuidad de Yates. 9. Si la tabla de contingencias es de 1 X i columnas, se aplica la X2 de bondad de ajuste. Pruebas de la estadística no paramétrica 85 10. Si la tabla de contingencia ese de 2 x 2 y cumple los requisitos 7 y 8, se aplica la prueba de corrección por continuidad de Yates. Procedimiento 1. Plantear las hipótesis estadísticas. 2. Determinar la probabilidad con la que se trabajará: p = .05, p = .01. 3. Distribuir los puntajes en la tabla de contingencia. 4. Calcular las frecuencias esperadas: 5. Aplicar la fórmula. 6. Obtener los gl. 7. Plantear regla de decisión. Este estudio tiene como propósito identificar el consumo de productos chatarra, en una muestra de 60 niños preescolares de la ciudad de México, así como la preferencia por alguno de estos productos. Entendiéndose por productos chatarra: pastelitos, frituras, refrescos y dulces. Paso 1. Hipótesis. Ho: no existen diferencias significativas en el consumo de productos chatarra en niños preescolares. H1: existen diferencias significativas en cuanto al consumo de productos chatarra por parte de los niños preescolares. Paso 2. Nivel de significancia p = .05. Paso 3. Distribución de los datos. Pastelitos Frituras Refrescos Dulces N fo fe 15 15 fo fe 28 15 fo fe 0 15 fo fe 7 15 60 Paso 4. Cálculo de fe. Sofía Rivera Aragón Mirna García Méndez 86 Paso 6. Obtener los grados de libertad. gl = k - 1 gl = 4 - 1 gl = 3 Paso 7. Reglade decisión. X2 ≥ X2t H1 se acepta y Ho se rechaza. X2t = chi cuadrada en tablas. En la tabla A del apéndice, se busca en la parte horizontal, el nivel de significancia previamente establecido .05, y en la parte vertical los gl, que en este ejemplo fue de 1. Esto resulta en lo siguiente: 17.18 ≥ 7.82. Se acepta la H1 Pruebas de la estadística no paramétrica 87 Paso 5. Desarrollo de la fórmula. Interpretación de resultados Se encontraron diferencias significativas X2 = 1 7 . 1 8 , p = .05 en el consumo de alimentos chatarra en los niños preescolares, lo que significa que difieren en el consumo de estos productos. Ejercicio SPSS Se empleará el mismo ejercicio desarrollado por la fórmula de preferencias de productos chatarra por niños preescolares. Paso 1. Se crea una variable que se denominará preferencias e incluirá 5 niveles de respuesta: 1 = pastelitos; 2 = frituras; 3 = refrescos; y 4 = dulces. Debido a que incluir las respuestas de los 60 niños en la base de datos implica mucho espacio, únicamente se presentarán los datos de 10 niños, pero el análisis y los resultados se llevarán a cabo con el total de las respuestas de los participantes. De esta manera la base de datos queda así: Sofía Rivera Aragón Mirna García Méndez 88 Paso 2. Se coloca el cursor en Analyze, se presiona el botón izquierdo del mouse y se muestra un menú en el que se coloca el cursor en Non-parametric test, aparece un menú en el que se coloca el cursor en Chi- Square y se da clic. Paso 3. Al hacer clic en Chi-Square se abre un menú. Pruebas de la estadística no paramétrica 89 Paso 4. En el menú del paso 3, se marca con el cursor la variable preferencias, se da clic en el icono ubicado entre la variable preferencia y Test Variable List, inmediatamente la variable preferencias aparece en Test Variable List. Paso 5. Se da clic en OK y se muestran los resultados en tablas. PREFERENCIAS Observed N Expected N Residual Pastelillos 15 15.0 .0 Frituras 28 15.0 13.0 Refrescos 10 15.0 -5.0 Dulces 7 15.0 -8.0 Total 60 Sofía Rivera Aragón Mirna García Méndez 90 Como se puede observar en la tabla 20, la X2 y la p difieren un poco de los resultados con la fórmula desarrollada, esto se debe a que en el SPSS las operaciones se realizan en forma precisa. Interpretación de resultados Se encontraron diferencias significativas X2 = 17.20, p = .001 en el consumo de alimentos chatarra en los niños preescolares, lo que significa que difieren en el consumo de estos productos. Pruebas para muestras relacionadas Estas pruebas implican dos medidas de una sola muestra. Se emplean cuando el investigador desea conocer si un tratamiento es mejor que otro o si dos tratamientos son diferentes. En este tipo de estudios se pueden em- TEST STATISTICS Preferencias Chi-Squarea 17.200 df 3 Asymp. Sig. .001 a.0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 15.0. Estas tablas no se presentan en el reporte de investigación, los datos contenidos en ellas se pueden presentar en tablas en otro formato. TABLA 20 DIFERENCIAS EN EL CONSUMO DE PRODUCTOS CHATARRA Pastelitos Frituras Refrescos Dulces X2 gl p 15 28 10 7 17.20 3 .00 1 N = 60. Pruebas de la estadística no paramétrica 91 plear dos grupos, sin embargo, los resultados que se obtengan pueden estar relacionados con un conjunto de eventos ajenos al tratamiento. Estos eventos se conocen como variables extrañas. Con la finalidad de controlar el efecto de estas variables extrañas, la persona puede fungir como su propio control, esto es, se le expone a ambas condiciones en diferentes ocasiones. Otra alternativa es el método de apareamiento, en el que se seleccionan pares de personas lo más semejantes posible en torno de las variables extrañas que puedan influir en los resultados del tratamiento. El inconveniente de este método es que depende de la capacidad del investigador para establecer que tan iguales son los pares (Siegel y Castellan, 2003). McNemar Es una prueba útil en los diseños antes-después (Álvarez, 1995) en los que cada sujeto se utiliza como su propio control. En la prueba de McNemar el objetivo es probar la significación de los cambios observados a partir de una tabla de contingencia 2x2 (Siegel y Castellan, 2003; Conover, 1980). Para probar la significancia de los cambios observados, los datos en la tabla expresan lo siguiente: Sofía Rivera Aragón Mirna García Méndez 92 Los grados de libertad empleados en McNemar es 1. gl = 1. Para obtener resultados más precisos, se emplea la corrección por continuidad que permite eliminar la fuente de imprecisión que resulta de emplear una distribución continua para aproximarse a una distribución discreta (Siegel y Castellan, 2003). Con esta corrección, la fórmula se expresa de la siguiente manera: Pruebas de la estadística no paramétrica 93 Los signos positivo y negativo sólo se emplean para indicar que hubo un cambio sin connotación de bueno o malo. Como se observa en la tabla, A + D son las personas cuyas respuestas cambiaron. De esta manera, la Ho plantea que el número de cambios en cada dirección es el mismo. Sustituyendo la fórmula: suma frecuencia obtenida frecuencia esperada donde: se obtiene lo siguiente: El signo | indica que al resultado de la resta de A - D, sin importar el signo + o - se le resta el 1. Por ejemplo, 6-15 = - 9, entonces se resta 9 - 1 = 8 Reglas para su empleo • En mediciones nominales y ordinales. • Que el número total de cambios sea mayor a 10. • Cuando la frecuencia esperada es menor a 5, se debe usar otra prueba. Procedimiento 1. Plantear las hipótesis estadísticas. 2. Determinar la probabilidad con la que se trabajará p=05, p = . 0 1 . 3. Distribuir los puntajes en la tabla de contingencia. 4. Aplicar la fórmula. 5. Plantear regla de decisión. Ejercicio Para evaluar la efectividad de un programa de intervención con 50 padres de familia de ciudad Nezahualcóyotl, se les preguntó si estaban de acuerdo o en desacuerdo con que sus hijos recibieran educación sexual en la escuela, tema a tratar como parte del programa a través de un taller. Antes del taller se les preguntó si estaban de acuerdo o en desacuerdo y al término del taller se les volvió a hacer la misma pregunta. Paso 1. Hipótesis Ho. La probabilidad de las madres que cambiaron de acuerdo a desacuerdo es igual a la probabilidad de las madres que cambiaron de desacuerdo a acuerdo en lo concerniente a que sus hijos reciban educación sexual en la escuela. H1. Después de haber asistido a un taller, las madres aceptan que sus hijos reciban educación sexual en la escuela. Paso 2. Nivel de significancia a emplear p = .05. Sofía Rivera Aragón Mirna García Méndez 94 Paso 5. Regla de decisión. X2 ≥ X2t H1 se acepta e Ho se rechaza. X2t = chi cuadrada tablas. En la tabla A del apéndice, se busca en la parte horizontal, el nivel de significancia previamente establecido .05, y en la parte vertical los gl, que en este ejemplo fue de 1. Esto resulta en que se acepta la H1. 10.25 ≥ 3.84. Se acepta la H1. Interpretación de resultados Estos resultados indican que el taller influyó en la opinión, ya que las madres que estaban en desacuerdo con que sus hijos reciban educación sexual en la escuela, ahora en su mayoría están de acuerdo (X2 =10.25, p=.05) Despues Desacuerdos Acuerdos Antes Acuerdos 9 6 Desacuerdos 5 30 Pruebas de la estadística no paramétrica 95 Paso 3. Distribución de las respuestas de los padres antes y después del taller. Paso 4. Desarrollo de la fórmula. Ejercicio SPSS La base de datos contiene las respuestas de los 50 padres de familia; sin embargo, con fines prácticos en esta tabla únicamente se incluye la información de 20 padres. La base de datos del paso 2, sólo incluye 10 de los 20 casos,
Compartir