Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
76 ❍ CAPÍTULO 2 DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS El puntaje z es una valiosa herramienta para determinar si es probable que una obser- vación particular se presente con frecuencia, o si es improbable y puede ser considerada como resultado atípico. De acuerdo con el teorema de Chebyshev y la Regla empírica, • al menos 75% y más probablemente 95% de las observaciones están a no más de dos desviaciones estándar de su media: sus puntajes z están entre �2 y 2. Las observaciones con puntajes z mayores a 2 en valor absoluto se presentan menos del 5% del tiempo y son consideradas un tanto improbables. • al menos 89% y más probablemente 99.7% de las observaciones están a no más de tres desviaciones estándar de su media: sus puntajes z están entre �3 y 3. Las observaciones con puntajes z mayores a 3 en valor absoluto se presentan menos del 1% del tiempo y son consideradas muy poco probables. Usted debe apreciar con cuidado cualquier observación que tenga un puntaje z mayor a 3 en valor absoluto. Quizá la medición fue registrada incorrectamente o no pertenece a la población que se muestrea. Quizá es sólo una observación muy poco probable, pero válida, con todo. Considere esta muestra de n mediciones: 1, 1, 0, 15, 2, 3, 4, 0, 1, 3 La medición x � 15 parece ser extraordinariamente grande. Calcule el puntaje z para esta observación y exprese sus conclusiones. Solución Calcule _ x � 3.0 y s � 4.42 para las n � 10 mediciones. Entonces el pun- taje z para el resultado atípico sospechoso, x � 15, se calcula como puntaje z � x � _ x _____ s � 15 � 3 ______ 4.42 � 2.71 En consecuencia, la medición x � 15 está 2.71 desviaciones estándar arriba de la media muestral, _ x � 3.0. Aun cuando el puntaje z no excede de 3, está cercano lo sufi ciente para que usted pueda sospechar que x � 15 es un resultado atípico. Usted debe examinar el procedimiento de muestreo para ver si x � 15 es una observación defectuosa. Un percentil es otra medida de posición relativa y se usa con más frecuencia para conjuntos grandes de datos. (Los percentiles no son muy útiles para conjuntos pequeños de datos.) Defi nición Un conjunto de n mediciones de la variable x se ha reacomodado en orden de magnitud. El p-ésimo percentil es el valor de x que es mayor a p% de las mediciones y es menor que el restante (100 � p)%. Supongamos que usted ha sido notifi cado que su califi cación de 610, en el Examen verbal de graduación, lo ha colocado en el 60avo percentil en la distribución de califi - caciones. ¿Dónde está su califi cación de 610 en relación a las califi caciones de los otros que tomaron el examen? Solución Califi car en el 60avo percentil signifi ca que 60% de todas las califi cacio- nes de examen fueron más bajas que la califi cación de usted y 40% fueron más altas. Los puntajes z mayores a 3 en valor absoluto son muy poco comunes. CONSEJOMIMI E J E M P L O E J E M P L O 2.11 2.12 Probabilidad_Mendenhall_02.indd 76Probabilidad_Mendenhall_02.indd 76 5/14/10 8:15:58 AM5/14/10 8:15:58 AM www.FreeLibros.me En general, el 60avo percentil para la variable x es un punto en el eje horizontal de la distribución de datos que es mayor a 60% de las mediciones y menor que las otras. Esto es, 60% de las mediciones son menores que el 60avo percentil y 40% son mayores (véase la figura 2.14). Como el área total bajo la distribución es 100%, 60% del área está a la izquierda y 40% del área está a la derecha del 60avo percentil. Recuerde que la me- diana, m, de un conjunto de datos es la medición central; esto es, 50% de las medicio- nes son más pequeñas y 50% son más grandes que la mediana. Entonces, ¡la mediana es igual que el 50avo percentil! Los percentiles 25avo y 75avo, llamados cuartiles inferior y superior, junto con la mediana (el 50avo percentil), localizan puntos que dividen los datos en cuatro conjun- tos, cada uno conteniendo un número igual de mediciones. Veinticinco por ciento de las mediciones serán menores que el cuartil inferior (primero), 50% serán menores que la me- diana (el segundo cuartil) y 75% serán menores que el cuartil superior (tercero). De este modo, la mediana y los cuartiles inferior y superior están ubicados en puntos en el eje x de modo que el área bajo el histograma de frecuencia relativa para los datos está dividida en cuatro áreas iguales, como se muestra en la figura 2.15. FIGURA 2.15 Ubicación de cuartiles ● FIGURA 2.14 El 60avo percentil mostrado en el histograma de frecuencia relativa para un conjunto de datos ● x Fr ec ue nc ia r el at iv a 60avo percentil 60% 40% x Fr ec ue nc ia r el at iv a Cuartil superior, Q3Cuartil inferior, Q1 Mediana, m 25%25%25%25% 2.6 MEDICIONES DE POSICIÓN RELATIVA ❍ 77 Probabilidad_Mendenhall_02.indd 77Probabilidad_Mendenhall_02.indd 77 5/14/10 8:15:58 AM5/14/10 8:15:58 AM www.FreeLibros.me 78 ❍ CAPÍTULO 2 DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS Defi nición Un conjunto de n mediciones en la variable x se ha acomodado en orden de magnitud. El cuartil inferior (primer cuartil), Q1, es el valor de x que es mayor a un cuarto de las mediciones y es menor que los restantes tres cuartos. El segundo cuartil es la mediana. El cuartil superior (tercer cuartil), Q3, es el valor de x que es mayor a tres cuartos de las mediciones y es menor que el restante un cuarto. Para conjuntos de datos pequeños, con frecuencia es imposible dividir el conjunto en cuatro grupos, cada uno de los cuales contiene exactamente 25% de las mediciones. Por ejemplo, cuando n � 10, usted necesita tener 2½ mediciones en cada grupo. Aun cuando usted efectúe esta tarea (por ejemplo, si n � 12), hay muchos números que satis- farían la definición precedente y, por lo tanto, podrían ser considerados “cuartiles”. Para evitar esta ambigüedad, usamos la siguiente regla para localizar cuartiles muestrales. CÁLCULO DE CUARTILES MUESTRALES • Cuando las mediciones están dispuestas en orden de magnitud, el cuartil infe- rior, Q1, es el valor de x en la posición .25(n 1), y el cuartil superior, Q3, es el valor de x en la posición .75(n 1). • Cuando .25(n 1) y .75(n 1) no son enteros, los cuartiles se encuentran por interpolación, usando los valores de las dos posiciones adyacentes.† Encuentre los cuartiles inferior y superior para este conjunto de mediciones: 16, 25, 4, 18, 11, 13, 20, 8, 11, 9 Solución Ordene las n � 10 mediciones de menor a mayor: 4, 8, 9, 11, 11, 13, 16, 18, 20, 25 Calcule Posición de Q1 � .25(n 1) � .25(10 1) � 2.75 Posición de Q3 � .75(n 1) � .75(10 1) � 8.25 Como estas posiciones no son enteros, el cuartil inferior se toma como el valor 3/4 de la distancia entre la segunda y tercera mediciones ordenadas, y el cuartil superior se toma como el valor 1/4 de la distancia entre la octava y novena mediciones ordenadas. Por tanto, Q1 � 8 .75(9 � 8) � 8 .75 � 8.75 y Q3 � 18 .25(20 � 18) � 18 .5 � 18.5 Como la mediana y los cuartiles dividen la distribución de datos en cuatro partes, cada una de ellas conteniendo alrededor de 25% de las mediciones, Q1 y Q3 son las fron- teras superior e inferior para el 50% central de la distribución. Podemos medir el ran- go de este “50% central” de la distribución usando una medida numérica llamada rango intercuartil. † Esta defi nición de cuartiles es consistente con la empleada en el paquete MINITAB. Algunos libros de texto em- plean redondeo ordinario cuando buscan posiciones de cuartil, mientras que otros calculan cuartiles muestrales como las medianas de las mitades superior e inferior del conjunto de datos. E J E M P L O 2.13 Probabilidad_Mendenhall_02.indd 78Probabilidad_Mendenhall_02.indd 78 5/14/10 8:15:58 AM5/14/10 8:15:58 AM www.FreeLibros.me
Compartir