Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
1 Medidas de Tendencia Central Dra. Mariela Ventura Estadística Aplicada a la Psicología Facultad de Psicología (UNT) 2017 Los procedimientos estudiados del punto anterior del programa permiten una descripción visual de la distribución de una variable mediante tablas y gráficos. ¿Qué es una tendencia central? ¿Y por qué nosotros queremos conocer la tendencia central de un grupo de puntajes? Imaginen esta situación: Estás en una clase justo con otros cuatro estudiantes. El profesor te está devolviendo las pruebas cuyo puntaje total sería de 5 puntos. Tu prueba lleva escrita la puntuación 3/5. ¿Cómo reaccionas? ¿Estás satisfecho o no con tu puntaje?, ¿Cómo lo decidís? Podes calcular el porcentaje de lo que has realizado correctamente y en este caso, sería de un 60 %. Pero tal vez es mejor, para decidir cómo reaccionar ante tu rendimiento considerar información adicional. ¿Qué información adicional necesitarías? Seguramente les hubieras preguntado cómo les fue a los otros, es decir, esa sería la información adicional para poder comparar tu puntuación. Si tu puntuación de 3 se encontrara entre los puntajes más altos de la clase estarías contento, de lo contrario, si fuese uno de los más bajos, no. Esta idea de comprar los puntajes es fundamental en estadística. Alumnos Grupo A Grupo B Grupo C Vos 3 3 3 Juan 3 4 2 María 3 4 2 Miguel 3 4 2 Lourdes 3 5 1 Ustedes pueden observar que en el primer Grupo A todos obtienen lo mismo y tu puntuación de 3, se encuentra exactamente en el centro de la distribución y puedes 2 estar contento porque has obtenido un puntaje como el de todos; en el segundo (Grupo B), tu puntaje es el más bajo; aun cuando tu puntaje es el mismo que en el Grupo A, pero los de los otros alumnos no, lo que pone a tu puntaje por debajo del centro de la distribución. Y en el último grupo (Grupo C), tu puntaje es el mejor puntaje, o sea que te encuentras por encima del centro de la distribución por lo tanto puedes sentirte muy satisfecho. Ahora cambiemos el ejemplo, a los fines de entender aún más el concepto de centro de la distribución. La figura 1 muestra los resultados de un experimento de memoria en las posiciones de piezas de ajedrez. A los sujetos se les mostraba las posiciones de las piezas de ajedrez y se les pedía luego que la reconstruyan en una tablero vacío para ver el número de piezas que eran recordadas; luego se repitió dos veces más este experimento. Los puntajes muestran el total de veces que las piezas fueron recordadas correctamente en las tres posiciones. Los dos grupos fueron comparados. En la izquierda del gráfico (de Tallo y Hojas) se muestran los resultados de Memoria en las personas que No Juegan Ajedrez. En la derecha se encuentran los Jugadores de Torneos de Ajedrez. Es claro que el centro de la distribución de los no jugadores es mucho más bajo que el de los jugadores de torneos. La derecha muestra los puntajes de los jugadores de torneos. Ahora estamos seguros de que ustedes tienen una idea somera sobre el centro de la distribución. Entonces, la Tendencia central es vagamente un concepto que tiene que ver con la localización del centro de la distribución. Otra definición de la tendencia central es aquél punto en el que la distribución se encuentra balanceada o en equilibrio. La siguiente figura muestra la distribución de 5 números 2, 3, 4, 9, 16. Si cada número pesara 1 gr, y es ubicado en su posición a lo largo de esta escala numérica, entonces sería posible equilibrarlos colocando un punto de apoyo en 6,8. 3 Ahora bien, supongamos que queremos comparar “el rendimiento en Estadística” de una muestra de 200 varones con una muestra de 250 mujeres. Esta comparación sería muy difícil si vamos a tener en cuenta cada una de las puntuaciones de ambos grupos. Lo que se suele hacer es comparar una medida que refleja la tendencia central como por ejemplo, el promedio de la primera muestra (varones) con el promedio de la segunda (mujeres). Este promedio o media surge de la medición de cada una de las puntuaciones de la muestra, que nos dará la posición central en la variable estudiada, en este caso, “la media del rendimiento estadístico, de una y otra muestra”. Por esta razón, irá tomando siempre un valor situado hacia el centro de las puntuaciones de cada una de dichas muestras. Entonces, ante una cantidad grande de casos este resumen de la muestra puede hacerse de una forma sencilla y precisa utilizando valores numéricos que den la idea de la ubicación o del centro de los datos –medidas de tendencia central-, y de otras que informen de la concentración de las observaciones alrededor de dicho centro- que son las medidas de dispersión. En la clase de hoy veremos estas dos medidas. Tomadas juntas, ambos tipos de medidas, resultarán normalmente adecuadas para la descripción, sobre todo de los datos de la escala de intervalos o de razón. Una de las formas de hacer un análisis estadístico es a partir del establecimiento de la tendencia central y de la dispersión. Cuando se han tabulado puntajes u otras medidas en una distribución de frecuencias, la tarea que sigue suele ser calcular la tendencia central, es decir en qué sector de la variable se concentran las observaciones. Por ello, también las suelen llamar de posición central. Es decir con un solo valor, voy a tratar de determinar en dónde se concentra la tendencia de una variable. Tenemos 3 medidas de tendencia central: Mo (Modo) o la moda, Md (Mediana) y M (Media). 4 El Modo, o la Moda es el valor de la variable que presenta la mayor frecuencia. Se procede a contar los casos en cada una de las categorías de la variable. Se puede determinar cuando la variable se encuentra en un nivel de medición nominal o superior. En el nivel de medición nominal, el modo es la categoría de mayor frecuencia, se cuentan cuántas observaciones corresponde a cada categoría. Por ejemplo: Grupo 1 (Mujeres): 160 y Grupo 2 (Varones): 60; el Mo es la categoría con mayor frecuencia, es decir, sería en este caso, Grupo 1, Mujeres (Grupo 1). Siempre se refiere a las categorías, las frecuencias me permiten definir dónde está concentrada la mayor cantidad de casos. En el nivel ordinal, el Mo se considera de la misma manera. A nivel intervalar si tenemos los valores sin agrupar que pueden ser una serie de Puntajes en un Test: 20 21 22 21 21 25; siendo el Mo el valor que más se repite en este caso, el Mo sería el puntaje 21. Si tenemos los valores agrupados en intervalos vamos a mirar cuál es el intervalo con la mayor frecuencia, y como se trata de un intervalo, se calculará el valor promedio de ese, que es el que representará al intervalo. Hay veces que las distribuciones tienen 2 ó 3 modos pero no tiene sentido sacar Mo cuando no hay una tendencia. La mediana (Md) A menudo necesitamos localizar la posición del caso medio o el que está en el medio, cuando los datos se han ordenado de menor a mayor. En este caso, estamos calculando la Md como tendencia central. Es decir que la Md es aquel valor ubicado en el centro de la distribución, por lo tanto deja por debajo de sí el 50% de los casos y por encima el otro 50 %, por lo tanto, excede y es excedido por más de la mitad de los casos. 5 Cuando tenemos una serie de datos sin agrupar, para determinar el valor mediano o el que representa el orden medio, primero debemos ordenar los datos de menor a mayor. Cuando el número de datos es par y están a un nivel ordinal, por ejemplo una serie de órdenes de mérito en un grupo de seis estudiantes. Primero siempre se ordenan los datos de menor a mayor, por ejemplo. Deficiente Deficiente Regular Bueno Muy Bueno Excelente La Md en este caso quedaría en los dos valores centrales, pero por convención, se decide que es el mayor de los dos centrales. Osea, la Md en este grupo de datos, es Bueno. A partir de Bueno tienen igual o menos o igual o más orden de mérito. Cuando los datos son impares, la mediana sería el valor que está en el medio: Deficiente Deficiente Regular Bueno Bueno Muy Bueno Excelente Md=Bueno Si son muchos los valores en una serie, se hace difícil establecer el valor del medio, por lo que se puede usar una fórmula sencilla que nos permite calcular el orden de la Md fácilmente, no la Md: � + 1 2 = ��� Por ejemplo, en el caso anterior, N= 7, por lo tanto ��� � = 4 = ���; lo que significa que el valor 4°, que corresponde a Bueno. Cuando los datos son pares y numéricos ordenados: 20 21 23 25 Se calcula el orden de la Md, esto es la,���, ��� � = 2,5; que significa el valor que está situado en la posición o en el orden 2 y ½ (es decir, entre el 2° y el 3°, entre 21 y 23 en este caso). Para calcular el valor medio entonces tenemos que hacer un promedio de los dos. 6 21 + 22 2 = 21,5 = �� Entonces, la Md es el valor que está en el medio, o el promedio de 21 y 23, que es igual a 22. En una serie de datos impares sin agrupar: 20 21 23 25 26 Se aplica la misma fórmula para hallar el orden de la Mediana y se obtiene que la Md cae en el tercer orden, o sea que corresponde al puntaje 23. O sea, que hay que ordenar los valores y hallar el valor central. La característica de la Mediana es que no toma en cuenta cada uno de los valores sino sólo el valor central. Cuando son datos agrupados Nivel de instrucción f Fa Universitario 5 225 Secundario 20 220 Primario 150 200 Ninguno 50 50 Total (N) 225 Mso=N/2=225/2=112,5 Ese valor 112, 5 está contenido entre las frecuencias acumuladas (Fa) que llegan hasta 200 casos, y éstas nos indican que la Mediana es Primario. 7 Cuando los datos están agrupados en intervalos: la Mediana se calcula con una fórmula. 8 Por ejemplo: Puntajes en un Test de aptitud mecánica aplicado aun grupo de alumnos de una escuela técnica. X f X´ F 40 –44 10 42 70 35-39 13 37 60 30-34 30 32 47 25-29 11 27 17 20-24 6 22 6 TOTAL 70 Modo=32 Mediana=Lex+ � � ��� � .�= 29,5+ ����� �� .5 = 30,83 Pasos para su cálculo: 1. Debo saber cuál es el valor que deja por debajo la mitad de las observaciones. Por eso aplico N/2. 2. Para ello miro las Frecuencias acumuladas y aquella que lo contenga al orden de la Md. 3. Aplico la fórmula para ver exactamente el valor contenido en ese intervalo mediano que deja por debajo el 50% de las observaciones. Cuando una distribución es incompleta (intervalos abiertos) sí se puede calcular la mediana (Md) no así la media (��) porque no incide para nada en su cálculo. Lo único que importa es ver cuál es el valor central, aquél que deja por arriba y por debajo el mismo número de casos (50 % para arriba y 50% para abajo). Media Aritmética o Promedio 9 Una descripción elemental de la localización de un conjunto de datos puede hacerse determinando su centro. La idea de la media o promedio formaliza el concepto intuitivo de punto de equilibrio o centro de gravedad de las observaciones. Se usa esta medida cuando estamos en un nivel de medición por lo menos intervalar. Por ejemplo, la clasificación media obtenida por un grupo de personas en un examen, el ingreso medio por familia en una comunidad, o el número medio de hijos por pareja. Dado un conjunto de observaciones: X1, X2, …, Xn. , la media se representa con el símbolo X� y se obtiene dividiendo la suma total de los datos X por el número de ellos. X� = ∑(X��X� + ⋯+ X�) N = Donde la letra griega ∑ (sigma mayúscula) significa sumatoria y se utiliza para escribir en forma abreviada el despliegue de toda la suma X1, X2, X3, …., Xn La media o promedio es la más común de las medidas de tendencia central y una de las que más se usa, porque también sirve para el cálculo de otras medidas. La media se define como la suma de todos los valores de las observaciones dividida por el número total de casos. Para representarla, se usa el símbolo X�. Su fórmula es la siguiente: �X� � ��� X� = ∑(X��X� + ⋯+ X�) N = X� = ∑ X� � ��� N Donde Xi representa las puntuaciones desde el primer individuo hasta n, que es el último. Aquí intervienen para su cálculo todos los valores y no sólo el central. Propiedades de la media 10 *La media posee la propiedad de que la suma de las desviaciones de cada valor con respecto a la media será siempre cero. Por ello se dice que la media es el centro de gravedad de los datos puede demostrar en una propiedad que afirma que la suma total de las desviaciones respecto a su media da cero. X1-X�; X2-X�, X3-X�….Xn -X� ∑ de1 a hasta n(X1-X�)=0 Esto se debe a que cuando las desviaciones se calculan con respecto a la media, las negativas se compensan con las positivas. *Otra propiedad importante de la media es que si sumamos diferentes variables, la media de la suma es igual a la suma de las respectivas medias, es decir: X + Y +⋯+ Z = X� + Y� +⋯+ Z� *La media es sensible a la variación de cada una de las puntuaciones. Basta con que varíe una sola puntuación para que varíe la media. La media es función de todas y cada una de las puntuaciones y variará con que varíe una de ellas. *Es función de los intervalos elegidos, de su amplitud, de su número y de los límites de los mismos. *Es fundamento de muchas otras técnicas estadísticas. *No podrá ser calculada si el intervalo máximo no tiene límite superior y/o el intervalo mínimo no tiene límite inferior. Pues si no conocemos los límites extremos no podremos calcular los puntos medios de los intervalos máximo y mínimo, por ende, no podremos calcular la media que exige conocer los puntos medios de todos los intervalos. Así no podremos calcular la media de una distribución de frecuencias como ésta: 11 X F 17 o más 9 14-16 15 11-13 22 8-10 13 7 o menos 8 Los datos pueden ser sin agrupar, agrupados, o agrupados en intervalos. Cuando los datos están agrupados (cada valor de la variable se multiplica por la frecuencia correspondiente), y en el caso de que sea una distribución de intervalos, primero se calcula el punto medio de cada intervalo, y ese valor medio de cada uno de los intervalos, se multiplica por la frecuencia de cada intervalo. Cuando una distribución es asimétrica el valor de la Media aparece desplazado porque como se vio, en su cálculo intervienen todos los valores, inclusive los más extremos. Entonces la media es una medida de tendencia central que se usa cuando la variable está a nivel intervalar o racional y representa la tendencia central verdaderamente cuando es simétrica la distribución o aproximadamente. Importa conocer cuáles son las ventajas y los inconvenientes de cada una de ellas, saber en cuáles circunstancias cada una sea la más adecuada. La media suele ser preferible a otros promedios porque está matemáticamente definida con nitidez y está basada sobre todas las medidas. Pero hay circunstancias en que la Md o el modo dan una estadística mejor. Cálculo de la Media Datos sin agrupar Se aplica directamente la fórmula antes expresada a los datos originales, es decir, sumando una a una las puntuaciones y dividiendo en el número total de casos (N) Por ejemplo en la variable Nº de obtienen una serie de datos en una serie sin agrupar: 0 2 5 0 3 1 8 0 3 1 1 9 2 4 0 2 9 3 0 1 9 8 Lo que se hace es sumar cada uno de los valores y dividir en el número de casos como sigue: En una serie de datos agrupados No de veces se compra un producto X f f.X 9 3 27 8 2 16 5 1 5 4 1 4 3 3 9 2 3 6 1 4 4 0 5 0 Total (N) 22 71 Datos Agrupados en Intervalos 1130520 X 12 Nº de vecesque se compra un determinado producto btienen una serie de datos en una serie sin agrupar: 0 2 5 0 3 1 8 0 3 1 1 9 2 4 0 2 9 3 0 1 9 8 Lo que se hace es sumar cada uno de los valores y dividir en el número de casos como En una serie de datos agrupados .X 27 16 5 4 9 6 4 0 71 Datos Agrupados en Intervalos 22,3 22 89103920429 n Xf X ´).( 22,3 22 71 X En promedio el producto es comprado 3,22 veces veces que se compra un determinado producto, y se Lo que se hace es sumar cada uno de los valores y dividir en el número de casos como En promedio el producto es Veces que se compra un producto (X) f 8-9 5 6-7 0 4-5 2 2-3 6 0-1 9 Total (N) 22 Usos de la Media 1. Cuando los puntajes están distribuidos simétricamente alrededor de un central, es decir cuando 2. Cuando se desea la medida de tendencia central que tenga la mayor estabilidad. 3. Cuando haya que calcular más tarde otros estadísticos que están basados en su cálculo. 4. Tiene que estar a un nivel intervalar o racional de m Se usa la Mediana 1. Cuando se desea el punto medio exacto de la distribución. 2. Cuando existen puntajes extremos o abiertos que incidirían en el cálculo de la media pero no de la mediana. 3. Se puede usar a nivel nominal, ordinal, e intervalar o del nivel ordinal y es conven Se usa el Modo 1. Por rapidez. 2. Cuando se quiere saber cuál es el valor más típico. 13 X´ f.X´ 8,5 42,5 6,5 0 4,5 9 2,5 15 0,5 4,5 71 Cuando los puntajes están distribuidos simétricamente alrededor de un central, es decir cuando la distribución no es muy sesgada. Cuando se desea la medida de tendencia central que tenga la mayor Cuando haya que calcular más tarde otros estadísticos que están basados en su Tiene que estar a un nivel intervalar o racional de medición. Cuando se desea el punto medio exacto de la distribución. Cuando existen puntajes extremos o abiertos que incidirían en el cálculo de la media pero no de la mediana. Se puede usar a nivel nominal, ordinal, e intervalar o racional. Es la específic del nivel ordinal y es conveniente cuando es asimétrica la distribución. Cuando se quiere saber cuál es el valor más típico. N Xf X ´. 22,3 22 71 X Cuando los puntajes están distribuidos simétricamente alrededor de un punto Cuando se desea la medida de tendencia central que tenga la mayor Cuando haya que calcular más tarde otros estadísticos que están basados en su Cuando existen puntajes extremos o abiertos que incidirían en el cálculo de la racional. Es la específica nte cuando es asimétrica la distribución. ´ 22 14 3. Cuando los valores están a nivel nominal es la única que se puede calcular. Bibliografía Amón, J. (1978). Estadística para psicólogos 1. Estadística Descriptiva, Madrid, Pirámide. Blalock, H. (1998). Estadística social, México, Fondo de Cultura Económica. Cohen , R. J y m. Swerdlik (2000). Pruebas y evaluación psicológicas. Introducción a la spruebas y a la medición, México, Mac Graw Hill. Cortada de Kohan, N. (1994). Diseño estadístico (para investigadores de las ciencias sociales y de la conducta), Buenos Aires, Eudeba. ______________y otros (2008). Técnicas de investigación científica. Buenos Aires: Lugar editorial. Pardo, A. y R. San Martín (1994). Análisis de datos en Psicología, Madrid, Pirámide. Peña, D. y J. Romo (1997).estadística para las ciencias sociales, Madrid, Mac. Graw Hill. San Martín Castellanos, R. y otros (1987). Psicoestadística Descriptiva, Madrid, Pirámide. 15 Medidas de Variabilidad Dra. Mariela Ventura Estadística Aplicada a la Psicología Facultad de Psicología (UNT) 2017 Los estadísticos o medidas de tendencia central indican dónde se sitúa un grupo de puntuaciones (zona alta, media o baja). Las medidas de variabilidad se refieren al grado de dispersión de los valores alrededor de la tendencia central. Los de variabilidad o dispersión nos indican si esas puntuaciones se encuentran muy próximas entre sí o muy dispersas. Es decir, se busca un punto de referencia (medida de tendencia central) a partir del cual se van a analizar las diferencias de las distintas observaciones. Ese punto de referencia es la media, y las diferencias se denominan desvíos (X- media)=x. Una de las formas de poder analizar estos desvíos (porque hemos visto que por propiedad suman 0) es elevarlos al cuadrado o considerarlos en términos absolutos como si fueran todos los valores positivos. Por ejemplo, dados 3 valores en dos muestras distintas: A: (7,9, y 11) y B: (1, 10, y 16) tienen la misma media (o posición) pero la variabilidad o dispersión de las puntuaciones del primer grupo es menor que de las puntuaciones del segundo. La variabilidad es un indicador de la forma en que las puntuaciones de una distribución están esparcidas o dispersas. Como dijimos dos o más distribuciones pueden tener la misma media aunque la diferencia en la dispersión puede ser amplia. Entonces, podemos encontrarnos con distribuciones que tienen la misma media, y sin embargo, distinta dispersión, como las que vemos abajo. 16 Las medidas estadísticas de variabilidad que describen la cantidad de variación de una distribución son: el rango o amplitud total, el rango intercuartilar o amplitud intercuartil, el rango semiintercuartilar o desviación semiintercuartil, la desviación estándar y la varianza. Desviación estándar o desviación típica A una solicitante de un puesto en una empresa se le aplicaron siete pruebas de procesamiento de palabras en el transcurso de siete días hábiles. Los resultados obtenidos por la candidata, de palabras por minuto en los 7 días, son los siguientes: 52 55 39 56 35 50 54 Nos proponemos calcular la variabilidaden estos datos. Aplicando la fórmula de la desviación típica para datos sin agrupar tenemos: n x s 2 63,128,1 28,1 7 54503556395552 22 222222 S s Tenemos la desviación estándar s= 1,28 y la varianza s2= 1,63. Veamos cómo se calcula: Pasos en el cálculo de SX en una distribución de frecuencias 17 Cuando los datos están agrupados en intervalos se calculará de la siguiente forma la desviación estándar: 1) Obtener los puntos medios de los intervalos 2) Restar a cada punto medio la media 3) Elevar esas diferencias o desvíos al cuadrado 4) Multiplicarlas por la frecuencia 5) Sumar los productos anteriores. 6) Dividir esta suma por n. 7) Sacar la raíz cuadrada de este cociente. Fórmula de la desviación estándar n xf s 2. Si la forma de la distribución es simétrica, se le suma y se le resta a la media la desviación estándar y queda demarcada un área central que comprende el 68% de los casos normales. A continuación calcularemos la desviación estándar de la distribución de puntajes de una muestra de la carrera de Psicología a la que se le aplicó una Prueba de Razonamiento. Puntajes Prueba de Razonamiento f X´ x ( XX ) x 2 f. x2 21-25 4 23 13,25 176.89 707,56 16-20 5 18 8,25 68,06 340,3 11-15 7 13 3,25 10,56 73,92 6-10 9 8 -1,75 3,06 27,54 1-5 15 3 -6,75 45,56 683,4 Total 40 1832,72 75,9X =9,8 18 � = � 1832,72 40 = 6,76 s= 6,76 Interpretación de la Desviación Típica Como ya hemos indicado este estadístico está relacionado con las deviaciones de las puntuaciones respecto de la media aritmética. Sin embargo, conviene indicar que es indicador de las diferencias individuales: entonces, cuánto mayores son estas diferencias individuales, mayores son esos indicadores o estadísticos descriptivos. Hemos visto cómo este estadístico ha partido de las diferencias de las puntuaciones respecto a la media aritmética. Por consiguiente cuando decimos que una muestra es másvariable que otra, estamos diciendo que en una muestra los datos están menos concentrados en torno a la media que en la otra. Comparar dos desviaciones típicas no siempre es posible. Por ejemplo, cuando decimos que en una muestra se obtuvo una desviación de 0,75 al medir la altura, y una desviación 15 al medir la variable inteligencia, no podemos llegar a interpretar que los sujetos de una muestra varían más en inteligencia que en altura porque son dos variables de naturaleza muy distinta. Se pueden comparar dos desviaciones de dos muestras obtenidas sobre una misma variable, siempre que las medias no sean exageradamente distintas. Desviación semi- intercuartil Se suele indicas con las letras AQ o C mayúscula. Su fórmula es la siguiente: ������ = ����� � En palabras es la diferencia entre el cuartil tercero y el cuartil primero, promediados. 19 En otras palabras es la semi-distancia entre el tercer cuartil y el primer cuartil. Es decir, entre el percentil 75 y el 25. Para su cálculo basta con calcular los cuartiles 3 y 1 o los percentiles 75 y 25 y hallar la semidiferencia entre ambos. Veamos las fórmulas del tercer y del primer cuartil: i f Fa n LQ i . 4 3 3 i f Fa n LQ i . 4 1 Dado el mismo ejemplo anterior de los puntajes en la prueba de razonamiento: Puntajes Prueba de Razonamiento F Fa 21-25 4 40 16-20 5 36 10,5-11-15-15,5 7 31 5,5-6-10-10,5 9 24 0,5-1-5- 5,5 15 15 Total 40 Se sigue el modelo del cálculo de la Md. Pasos: 1) Se calcula primero para el cuartil primero la cuarta parte del total y para e tercero las tres cuartas partes del total para ver cuál es la observación que deja por debajo ese porcentaje de casos. 2) Ubicamos en la columna de frecuencias acumuladas el intervalo que deja por debajo la ¾ parte y la ¼ parte de las observaciones. 20 30 4 3 10 4 n n 3) Hallamos los límites exactos inferiores de los intervalos señalados. 4) Aplicamos la fórmula: i f Fa n LQ i . 4 3 3 = 78,145. 7 2430 5,103 Q i f Fa n LQ i . 4 1 83,35. 15 010 5,01 Q El cuartil 3, correspondiente a la puntuación 14, 78 deja por debajo el 75 % de los casos. El cuartil 1, correspondiente al puntaje 3,83 deja por debajo el 25% de los casos. 5) Finalmente aplicamos la fórmula de la amplitud semi intercuartil: 2 13 QQAQ 475,5 2 83,378,14 AQ La semisuma del cuartil tres y el cuartil 1 comprende una distancia de 5,475 puntos. Allí está comprendido el 50% de la distribución. *Si la distribución no es muy asimétrica es una buena medida de la densidad en su parte media. 21 * De todas, maneras es la medida de variabilidad que acompaña a la mediana como medida de tendencia central. *Es decir, que es preferible a la desviación típica en caso de distribuciones muy asimétricas. *Cuando el intervalo máximo carece de límite superior o el mínimo de límite inferior, es imposible calcular la desviación típica. Bajo estas condiciones es posible calcular la desviación semi intercuartil siempre que el primero y el tercer cuartil no se encuentre en esos intervalos extremos. *Definida como distancia entre dos puntos sólo es calculable a nivel de intervalos o de razón pero no a nivel meramente ordinal. *Es menos sensible que la desviación típica, a la variación de los datos. Amplitud Total o rango o recorrido *Es la diferencia entre la puntuación máxima y mínima. mínmáxAT *Aunque es muy sencilla de calcular tiene varios inconvenientes puesto que no utiliza todos los datos de la muestra: *El primer inconveniente que presenta e s que s muy inestable. Porque utiliza dos puntuaciones, las extremas. Si éstas se mantienen constantes la amplitud también lo hará aunque varíen las comprendidas entre ambas. *El segundo, es que no es muy independiente en general, del tamaño de las muestras. Por ello, las amplitudes calculadas en muestras de distinto tamaño no son directamente comparables. Sólo es eficaz con muestras pequeñas. *En general, se puede afirmar que no es una medida muy recomendable para estudiar diferencias individuales. *En caso de que las variables estén agrupadas en intervalos se calcula l diferencia entre los límites exactos inferior y superior. 22 Consideremos dos muestras: A: 4 7 9 11 12 B: 4 8 16 20 24 La amplitud total en A= 12-4=8 La amplitud total en B= 24-4=20 De acuerdo con ello, podemos concluir que en efecto, las puntuaciones se dispersan más en B que en A. *Es la más sencilla de las medidas de variabilidad. Bibliografía Amón, J. (1978). Estadística para psicólogos 1. Estadística Descriptiva, Madrid, Pirámide. Blalock, H. (1998). Estadística social, México, Fondo de Cultura Económica. Cohen , R. J y m. Swerdlik (2000). Pruebas y evaluación psicológicas. Introducción a la spruebas y a la medición, México, Mac Graw Hill. Cortada de Kohan, N. (1994). Diseño estadístico (para investigadores de las ciencias sociales y de la conducta), Buenos Aires, Eudeba. ______________y otros (2008). Técnicas de investigación científica. Buenos Aires: Lugar editorial. Pardo, A. y R. San Martín (1994). Análisis de datos en Psicología, Madrid, Pirámide. Peña, D. y J. Romo (1997).estadística para las ciencias sociales, Madrid, Mac. Graw Hill. San Martín Castellanos, R. y otros (1987). Psicoestadística Descriptiva, Madrid, Pirámide.
Compartir