Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Nombre de la asignatura Estadística para la investigación en seguridad pública 3º semestre Clave: LIC. 01142315 Unidad 3 Estadística inferencial para dos poblaciones Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / Seguridad Pública 2 Índice Presentación .................................................................................................................................................................................................... 3 Propósitos ........................................................................................................................................................................................................ 3 Competencia a desarrollar ............................................................................................................................................................................... 4 Dos muestras independientes .......................................................................................................................................................................... 4 Intervalo de confianza para dos medias ....................................................................................................................................................... 5 Varianzas conocidas ................................................................................................................................................................................. 7 Varianzas desconocidas ........................................................................................................................................................................... 8 Varianzas iguales ..................................................................................................................................................................................... 9 Varianzas distintas .................................................................................................................................................................................. 14 Prueba de hipótesis para dos proporciones ............................................................................................................................................... 17 Cierre ............................................................................................................................................................................................................. 22 Fuentes de consulta ...................................................................................................................................................................................... 23 Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / Seguridad Pública 3 Presentación Bienvenido(a) a la última unidad de la asignatura “Estadística para la investigación en seguridad pública”. En esta unidad se determinarán los intervalos de confianza para la diferencia de dos medias poblacionales y la diferencia de dos proporciones poblacionales; asimismo, se realizarán pruebas de hipótesis para las dos situaciones descritas. En los intervalos de confianza para dos medias se analizan los casos en los que las varianzas son conocidas y cuando son desconocidas (iguales o diferentes). Propósitos Al término de esta unidad lograrás: Comprender el procedimiento que permite determinar el intervalo de confianza en el caso de la diferencia de dos medias poblacionales independientes, para las distintas situaciones que se presentan según sea la varianzas de las dos poblaciones. Aplicar la metodología que permite realizar una prueba de hipótesis para la diferencia de dos medias. Comprender el procedimiento sobre el cálculo del intervalo de confianza para la diferencia de dos proporciones poblacionales. Aplicar la metodología sobre la prueba de hipótesis para la diferencia de dos proporciones. Muestra poblacional Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / Seguridad Pública 4 Competencia a desarrollar Compara dos muestras poblacionales independientes para interpretar información que oriente en la toma de decisiones a través de técnicas de estadística inferencial. Dos muestras independientes En las unidades anteriores se estudió la manera de realizar una prueba de hipótesis para una media poblacional y para una proporción poblacional. Ahora se mostrará la forma de realizar una estimación por intervalo y realizar pruebas de hipótesis cuando se tienen dos poblaciones, y lo que interesa es la diferencia entre dos medias poblacionales o la diferencia entre dos proporciones poblacionales. Este tipo de problema es mucho más frecuente en la vida real, puesto que en muchas ocasiones lo que interesa es hacer un comparativo entre las medias. Por ejemplo, si se desea tomar la decisión sobre el tipo o marca de lámparas que un municipio debe comprar, se pueden comparar las vidas medias de cada tipo de lámpara para decidir. Si se hiciera una gran cantidad de muestreos para cada uno de los dos tipos de lámparas, se obtendrían las medias de cada una de las muestras y después se harían las diferencias de estas por pares. Por ejemplo, __ 2 __ 1 xx . Puede observarse que la distribución así formada se comporta de manera normal, por tal razón es que resulta posible darle un tratamiento parecido a lo hecho anteriormente. Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / Seguridad Pública 5 Para hacer una inferencia acerca de la diferencia de las medias de dos poblaciones, se elige una muestra aleatoria simple de tamaño 1n unidades de la población 1 y otra muestra aleatoria simple de tamaño 2n unidades de la población 2. A estas dos muestras que se toman separadas y sin que la elección de la primera afecte a la segunda, se les conoce como muestras aleatorias simples independientes. Para que los métodos descritos en las secciones siguientes sean válidos, resulta extremadamente importante asegurarse de que las muestras tomadas sean aleatorias simples independientes, ya que de otra manera los métodos descritos no sirven. Intervalo de confianza para dos medias Para estimar la diferencia entre dos medias poblaciones 21 se toma una muestra aleatoria simple de 1n elementos de la población 1 y una muestra aleatoria simple de 2n elementos de la población 2, y se calculan las dos medias muestrales: Sea __ 1x la media obtenida de la muestra aleatoria simple de tamaño 1n . Sea __ 2x la media obtenida de la muestra aleatoria simple de tamaño 2n . Si ambas poblaciones tienen distribución normal o si los tamaños de las muestras son suficientemente grandes, por el teorema del límite central se sabe que las distribuciones muestrales de __ 1x y __ 2x pueden ser aproximadas mediante una distribución normal, de manera que la distribución muestral de __ 2 __ 1 xx tendrá una distribución normal, cuya media es __ 2 __ 1 y una varianza dada por 2 2 2 1 2 12 nn . Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / Seguridad Pública 6 La estimación por intervalo de la diferencia entre las dos medias poblacionales es: 2 2 2 1 2 1 2 __ 2 __ 121 2 2 2 1 2 1 2 __ 2 __ 1 nn zxx nn zxx En la fórmula puede apreciarse que será necesario conocer la varianzas de las poblaciones, es decir, 2 1 y 2 2 ; por esa razón se deben considerar dos casos: 1. Cuando las varianzas son conocidas. 2. Cuando las varianzas son desconocidas: Desconocidas pero iguales. Desconocidas y distintas. Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / Seguridad Pública 7 Varianzas conocidas A continuación se ejemplifica el método para determinar el intervalo de confianza para la diferencia de dos medias cuando las varianzas son conocidas. Ejemplo (1) Cierto grupo de abogados tienen dos despachos representativos en casos de niños, uno en la periferia de la ciudad 1T y otro en un centro comercial 2T . El gerente regional ha observado que casos que se llevan a término excelente en uno, no lo son en el otro y él cree que esa situación se debe a ciertas diferencias entre los clientes de los dos despachos, por ejemplo, edad, educación, ingreso, etc. Para corroborar su idea, pide que se investigue la diferencia entre las medias de las edades de los clientes de los dos despachos. De acuerdo con datos de estudios anteriores sobre los clientes, se sabe que las desviaciones estándar poblacionales de cada una de las tiendas son años 91 y años 102 . Solución: Si se toma una muestra aleatoria simple de tamaño 1n clientes de la población 1 y una muestra aleatoria simple de tamaño 2n clientes de la población 2, y se calculan las dos medias muestrales, los valores obtenidos son: 1T 2T Tamaño de la muestra 361 n 492 n Media muestral años 40 __ 1 x años 35 __ 2 x Con esta información, la estimación por intervalo de 21 con 95% de confianza se encuentra haciendo: Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / Seguridad Pública 8 06.994.0 06.4506.45 49 100 36 81 96.13540 49 100 36 81 96.13540 21 21 21 2 2 2 1 2 1 2 __ 2 __ 121 2 2 2 1 2 1 2 __ 2 __ 1 nn zxx nn zxx El valor encontrado puede interpretarse de dos formas: 1. La diferencia de las edades promedio de las poblaciones de los clientes que van a los despachos 1 y 2 oscila entre 1 y 9 años. 2. La edad promedio de los clientes que van al despacho 1 es mayor entre 1 y 9 años que la edad promedio de los clientes que van al despacho 2. Varianzas desconocidas Cuando no se conocen las varianzas de las poblaciones, tanto en las estimaciones por intervalo como en las pruebas de hipótesis, se emplea la distribución t de Student en lugar de la distribución normal estándar; es decir, lo que debe hacerse es remplazar las z por t en la fórmula ya conocida: 2 2 2 1 2 1 2 __ 2 __ 121 2 2 2 1 2 1 2 __ 2 __ 1 nn zxx nn zxx Con lo que se obtiene: 2 2 2 1 2 1 2, 2 __ 2 __ 121 2 2 2 1 2 1 2, 2 __ 2 __ 1 2121 nn txx nn txx nnnn Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / Seguridad Pública 9 Sin embargo, no es posible realizar las estimaciones con la fórmula anterior, pues aún se deben considerar dos situaciones que se resuelven de manera diferente: 1. Cuando las varianzas son iguales. 2. Cuando las varianzas son diferentes. Varianzas iguales Generalmente, cuando se estudia una población no se conocen sus parámetros y, por ello, se toman muestras para estimarlos. En algunos casos se llega a observar que las varianzas de dos poblaciones son muy parecidas, motivo por el que, aun siendo desconocidas, se infiere que son iguales y a partir de esa inferencia se estima el intervalo de confianza para la diferencia de las medias usando la siguiente expresión: 21 2, 2 __ 2 __ 121 21 2, 2 __ 2 __ 1 1111 2121 nn stxx nn stxx p nn p nn Por otra parte, la desviación estándar se estima haciendo: 2 11 21 2 22 2 112 nn snsn sp Ejemplo (2) Un investigador privado de casos difíciles asegura que la vida media de sus asuntos excede en más de 1000 horas la vida media de los casos de uno de sus competidores. Para contrastar la afirmación, con un nivel de confianza del 95%, se probaron nueve casos del investigador y siete de su competidor. En la tabla se muestra la duración de los asuntos para ambos muestreos, en miles de horas: Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / Seguridad Pública 10 Investigador privado 66.4 61.6 60.5 59.1 63.6 61.4 62.5 64.4 60.7 Competidor 58.2 60.4 55.2 62.0 57.3 58.7 56.1 a) Calcular la media y la varianza de cada muestra. b) Explicar qué tipo de modelo de probabilidad sigue la diferencia de medias. c) Determinar el intervalo de confianza. Solución: A continuación se presentan los cálculos necesarios para dar respuesta a cada uno de los incisos. a) Para la muestra del investigador privado, se tiene: 24.62 9 60.764.462.561.463.659.160.561.666.4__ 1 x 03.5 19 62.24-60.762.24-64.462.24-62.5 62.24-61.462.24-63.662.24-59.1 62.24-60.562.24-61.662.24-66.4 222 222 222 2 1 s Para la muestra del competidor: Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / Seguridad Pública 11 27.58 7 56.158.757.362.055.260.458.2__ 2 x 61.5 19 58.27-56.1 58.27-58.758.27-57.358.27-62.0 58.27-55.258.27-60.458.27-58.2 2 222 222 2 2 s b) Como no se conocen las varianzas poblacionales, y al encontrar las varianzas muestrales se ve que sus valores son cercanos, se puede considerar que la diferencia de medias se distribuye como t de Student con 221 nn grados de libertad. Para los grados de libertad se hace: 14221 nn c) Para determinar el intervalo de confianza, primero se debe estimar la varianza ponderada ( 2 ps ). 284.5 279 61.51703.5192 ps Por tanto, la desviación estándar será: 298.2ps . Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / Seguridad Pública 12 Para el intervalo de confianza se sustituyen los valores calculados en: 21 2, 2 __ 2 __ 121 21 2, 2 __ 2 __ 1 1111 2121 nn stxx nn stxx p nn p nn Con lo que se obtiene: 21 7 1 9 1 298.2145.227.5824.62 Y al mismo tiempo: 7 1 9 1 298.2145.227.5824.6221 Por tanto: 454.6486.1 484.297.3484.297.3 21 21 Como la diferencia de las medias poblacionales está entre 1486 horas y 6454 horas, se puede concluir que la afirmación del investigador es cierta. En la unidad 2 se vio la relación entre intervalos de confianza y pruebas de hipótesis. En esa misma línea de ideas, puede mostrarse que la metodología descrita también es aplicable para el caso de dos poblaciones y la diferencia de sus medias.Ejemplo (3) Para la situación descrita en el ejemplo 2, ahora se probará la hipótesis de que la vida de los casos del investigador privado excede en más 1000 horas la vida media de los casos de uno de sus competidores. Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / Seguridad Pública 13 Solución: Siguiendo los pasos descritos con anterioridad para la prueba de hipótesis: 1) Parámetro medias poblacionales 1 y 2 2) Hipótesis nula horas 1000: 210 H 3) Hipótesis alternativa horas 1000: 211 H 4) Nivel de significancia 05.0 Probabilidad del 0.95 95% de confianza 5) Estadística 2, 21 nn t 6) Datos horas 200,62 __ 1 x , horas 240,21 s horas 270,58 __ 2 x , horas 370,22 s 7) Estandarización 529.2 7 1 9 1 2987.2 127.582.62 0 t Valor crítico 76.1t 8) Decisión Rechazar 𝐻0 y aceptar 𝐻1 Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / Seguridad Pública 14 dado que 14,05.00 tt Conclusión: La vida media de los casos del investigador privado sí excede en más de 1,000 horas a la vida media de los casos del competidor. 76.114,05.0 t Región de rechazo Región de no rechazo de Ho 529.20 t Tal y como se esperaba, las conclusiones obtenidas con ambas metodologías son las mismas. Varianzas distintas Cuando se desconocen las varianzas y se ha monitoreado el comportamiento de las poblaciones, hay casos en los que se observa que las varianzas de dos poblaciones son muy diferentes, de manera que se estiman con las varianzas muestrales. A partir de esa inferencia, el intervalo de confianza para la diferencia de las medias se determina con: 2 2 2 1 2 1 2 __ 2 __ 121 2 2 2 1 2 1 2 __ 2 __ 1 n s n s txx n s n s txx Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / Seguridad Pública 15 Los grados de libertad de t de Student se calculan haciendo: 11 2 2 22 2 1 1 22 1 2 1 2 1 1 2 1 n n s n n s n s n s Otra forma de escribir la fórmula anterior es: 2 22 2 21 22 1 1 2 1 2 1 1 2 1 1 1 1 1 n s nn s n n s n s Ejemplo (4) Se realiza un estudio para identificar diferencias entre los ingresos de los empleados de dos juzgados; se toma una muestra aleatoria simple de 28 empleados en el primero y otra muestra aleatoria simple e independiente de 22 empleados en el segundo. Se determina la media y la desviación estándar y se muestran los datos resumidos: Juzgado 1 Juzgado 2 Tamaño de la muestra 281 n 222 n Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / Seguridad Pública 16 Media muestral 025,1$ __ 1 x 910$ __ 2 x Desviación estándar muestral 150$1 s 125$2 s Se desea estimar la diferencia entre el sueldo medio de los trabajadores del juzgado 1 y el sueldo medio de los trabajadores del juzgado 2. Solución: Primero se determinan los grados de libertad para obtener tα/2: 8.47 22 125 122 1 28 150 128 1 22 125 28 150 2 2 2 2 2 22 v Como el resultado no es un número entero, se redondea hacia el número entero inferior 47 para tener un valor t mayor y dar una estimación por intervalo más prudente. En la tabla de la distribución t para 47 grados de libertad, se encuentra 012.247,025.0 t . El intervalo de confianza de 95% para la diferencia entre dos medias poblacionales se calcula como sigue: 28.19371.36 7811578115 22 125 28 150 012.2115 22 125 28 150 012.2115 21 21 22 21 22 Por tanto, el sueldo medio de los empleados del juzgado 1 excede en, al menos, $36.00 el sueldo medio de los empleados del juzgado 2 y, cuando mucho, en $194.00. Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / Seguridad Pública 17 Prueba de hipótesis para dos proporciones En la unidad anterior se realizaron pruebas de hipótesis cuando se deseaba tomar una decisión sobre una hipótesis en particular, ahora se realizará una prueba de hipótesis sobre la diferencia entre las proporciones de dos poblaciones, de manera que las tres formas de las pruebas de hipótesis son: 0: 0: 211 210 ppH ppH 0: 0: 211 210 ppH ppH 0: 0: 211 210 ppH ppH Puede apreciarse que en todas las hipótesis consideradas se usa el cero como la diferencia de interés; por ejemplo, si se supone que 0H , considerada como igualdad, es verdadera, se tiene 021 pp , lo que equivale a decir que las proporciones poblacionales son iguales, es decir, 21 pp . La distribución muestral de la diferencia de proporciones se puede aproximar mediante una distribución binomial, que tiene una proporción ___ p , obtenida de combinar los estimadores puntuales de las dos muestras, ___ 1p y ___ 2p . El estimador puntual de p es denominado estimador combinado de p , y es un promedio ponderado de ___ 1p y ___ 2p , es decir: Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / Seguridad Pública 18 21 ____ 22 ____ 11 ___ nn pnpn p . Por otra parte, con muestras grandes, es decir, cuando ____ 11 pn , ____ 11 1 pn , ____ 22 pn y ____ 22 1 pn sean todos mayores o iguales a 5, el estadístico de prueba para pruebas de hipótesis acerca de ___ 2 ___ 1 pp está dado por: 21 ____ ___ 2 ___ 1 0 11 1 nn pp pp z . Ejemplo (5) Una compañía de seguridad privada desea comercializar un nuevo servicio de protección, por lo que su departamento de mercadotecnia debe saber si hay diferencia en las proporciones de mujeres jóvenes y mayores que comprarían el servicio. Se muestrean dos poblaciones independientes: mujeres jóvenes y mujeres mayores y se consideran un nivel de confianza del 95%. Mujeres jóvenes Mujeres mayores Tamaño de la muestra 100 200 Sí les gustó 19 62 Solución: Siguiendo los pasos descritos con anterioridad para la prueba de hipótesis: 1) Parámetro proporciones poblacionales 1p y 2p 2) Hipótesis nula 0: 210 ppH Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / Seguridad Pública 19 3) Hipótesis alternativa 0: 211 ppH 4) Nivel de significancia 05.0 Probabilidad del 0.95 95% de confianza 5) Estadística 2 z 6) Datos 19.0 100 19____ 1 p 31.0 200 62____ 2 p 27.0 200100 31.020019.0100___ p 7) Estandarización 200 1 100 1 27.0127.0 31.019.0 0z 2069.20 z Valor crítico 96.1 2 z 8) Decisión Rechazar 0H y aceptar 1H dado que 25.00 zz Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / SeguridadPública 20 Conclusión: Se rechaza la hipótesis de que la proporción de mujeres jóvenes que compraría el servicio de protección es igual a la proporción de mujeres mayores. 96.125.0 z Región de rechazo Región de no rechazo de Ho 2069.20 z Región de rechazo Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / Seguridad Pública 21 Ejemplo (6) Para el problema descrito en el ejemplo 5 se determinará el intervalo de confianza para la diferencia de proporciones. Solución: Ahora se calculará el intervalo de confianza usando: 21 ____ 0 ____ 2 ____ 1 21 21 ____ 0 ____ 2 ____ 1 11 1 11 1 nn ppzpp pp nn ppzpp Sustituyendo los valores calculados se tiene: 21 200 1 100 1 27.0127.096.131.019.0 pp Y al mismo tiempo: 200 1 100 1 27.0127.096.131.019.021 pp Por tanto: 013.0226.0 1065.012.01065.012.0 21 21 pp pp De aquí puede verse que la proporción de la primera población (mujeres jóvenes) siempre será menor que la proporción de mujeres mayores; este resultado es consistente con lo que se concluyó en el ejemplo 5. Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / Seguridad Pública 22 Cierre En esta última unidad se establecieron intervalos de confianza tanto para la diferencia de dos medias poblacionales como para la diferencia de dos proporciones poblacionales. Se revisó que para determinar los intervalos de confianza para dos medias debían analizarse los casos en los que las varianzas son conocidas, o aquellos cuando son desconocidas pero se pueden considerar iguales, y finalmente, cuando son desconocidas pero se sabe que son diferentes. Adicionalmente, y puesto que se sabía de una relación entre los intervalos de confianza y las pruebas de hipótesis, se realizaron pruebas de hipótesis para la diferencia de dos medias con la intención de comparar los resultados obtenidos con ambos procedimientos. Se revisaron y aplicaron los procedimientos para la determinación del intervalo de confianza y para la realización de una prueba de hipótesis en el caso de la diferencia de dos proporciones. Estadística para la investigación en seguridad pública Unidad 3. Estadística inferencial para dos poblaciones División de Ciencias Sociales y Administrativas / Seguridad Pública 23 Fuentes de consulta (s. a.) (s. f.). Pruebas de hipótesis para la media con muestra grande. Recuperado de https://goo.gl/k6Ed2A Anderson, D. R. (2012). Estadística para administración y economía (11ª ed.). México: Cengage Learning. Berenson, M. L. (2001). Estadística para administración (2ª ed.). México: Pearson Education. Devore, J. L. (2012). Probabilidad y estadística para ingeniería y ciencias (11ª ed.). México: Cengage Learning. Gálvez, G. (2012). Apuntes de estadística. Recuperado de http://goo.gl/tVKOTK Hoel, P. G. (1991). Estadística elemental (4ª ed.). México: CECSA. Kazmier, L. y Díaz, A. (2006). Estadística aplicada a administración y a la economía (4ª ed.). España: McGraw-Hill. Lind, D. A., Marchal, W. G. y Whaten, S. A. (2008). Estadística aplicada a los negocios y la economía (13ª ed.). México: McGraw-Hill. Lind, D. A., Mason, R. D. y Marchal, W. G. (2001). Estadística para administración y economía (3ª ed.). México: McGraw-Hill. Mayes, A. C. y Mayes, D. G. (1980). Fundamentos de estadística para economía. México: Limusa. Naiman, A., Rosenfeld, R. y Zirkel, G. (1987). Introducción a la estadística (3ª ed.). México: McGraw-Hill. Nieves, A. y Domínguez, F. C. (2010). Probabilidad y estadística para ingeniería. México: McGraw-Hill. Pagano, R. R. (2011). Estadística para las ciencias del comportamiento (9ª ed.). México: Cengage Learning. Ross, S. M. (2008). Introducción a la estadística. España: Reverté. Vitutor (2010). Ejercicios y problemas de contraste de hipótesis. Recuperado de http://goo.gl/UyA5JN https://goo.gl/k6Ed2A http://goo.gl/tVKOTK http://goo.gl/UyA5JN
Compartir