Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
MUESTREO PROBABILISTICO PROBLEMA: Por razones de gobierno se desea conocer el ingreso total (o el ingreso promedio que es otra forma de presentar la información) de los habitantes de la provincia de Jujuy "en un momento dado", entrevistando para tal propósito a las unidades familiares que viven en la provincia POBLACION (o UNIVERSO) de nuestro estudio: ¿conjunto de unidades familiares en la provincia? La población es el conjunto de ingresos totales ($) de las citadas unidades familiares. Nos interesan las mediciones de la variable "ingreso" ($) y no la entidad física "unidad familiar". POBLACION es la totalidad de observaciones en las que se está interesado. Métodos alternativos para reunir la información necesaria: (a) CENSAR: Esto es, entrevistar a todos los integrantes de la población. (b) MUESTREAR: Entrevistar solamente a un subconjunto de la población. Una MUESTRA es un subconjunto de la población. VENTAJAS DEL MUESTREO 1) Casos en los que siempre debe muestrearse (debido a características de la población, naturaleza del método de estudio, etc.): Población infinita. Población de tamaño desconocido. Muestreo destructivo. 2) A menudo conviene muestrear por razones de: Tiempo: oportunidad – cambios en la población Costo Calidad DESVENTAJAS DEL MUESTREO 1) La información de una muestra no es la de la población. Se introduce un elemento más de aproximación. 2) Cuando se quiere desagregar mucho a los datos (clasificaciones cruzadas por varios atributos), la cantidad de información juega un papel preponderante. Aún los censos pueden resultar insuficientes para que ciertas clasificaciones cruzadas tengan relevancia estadística. En lo sucesivo supondremos que por alguna razón de las expuestas, o por otras, ya se ha decidido tomar solo una muestra. Ejemplos del censo TIPOS DE MUESTRAS Si las inferencias de la muestra para la población han de ser válidas, es importante obtener muestras representativas de la población. a) Muestra seleccionada "por expertos" De alguna manera especial se decide la muestra que se tomará, basada en razonamientos o consideraciones de algún tipo. b) Muestra Probabilística : Es aquella en la que los elementos de la muestra se seleccionan con base en probabilidades conocidas. b1) "Al azar o aleatorio": Las formas más sencillas de este método consiste en poner a toda la población en una urna, y extraer al azar, con reposición o sin ella, la muestra del tamaño deseado. Es decir se pueden utilizar dos métodos básicos para seleccionar la muestra al azar: con reemplazo o sin reemplazo. Con Reemplazamiento: Todas las muestras tienen la misma probabilidad de ser seleccionadas y Todas las unidades de la población tiene la misma probabilidad de ser seleccionadas para formar parte de la muestra. Coincide con el muestreo de poblaciones infinitas. Sin Reemplazamiento: Cada una de las Comb(N, n) muestras, tiene la misma probabilidad de ser escogida. N: tamaño de la Población y n: tamaño de la muestra. Todas las unidades de la población tienen la misma probabilidad de ser extraídas, pero si la población es finita, la probabilidad de que salga un elemento dependerá de los que fueron separados anteriormente para formar parte de la muestra y dejaron, por lo tanto, de pertenecer a los seleccionables. También se llama a este método: muestreo irrestricto aleatorio o muestreo aleatorio simple (muestreo al azar sin reemplazamiento). Ya sea que se realice el muestreo con reemplazo en poblaciones finitas o sin reemplazo en poblaciones infinitas (tal como algunos procesos continuos de producción) las fórmulas que se utilizan son las mismas. El muestreo “al azar” se utiliza cuando a priori no conocemos que elementos de la población tendrán valores altos de ella. Cuando dispongamos de información sobre la población, conviene tenerla en cuenta al seleccionar la muestra. b.2 Se denomina MUESTREO ESTRATIFICADO aquel en que los elementos de la población se dividen en clases o estratos, y la muestra se toma asignando un número determinado de miembros a cada estrato y escogiendo por muestreo al azar dentro del estrato. Existen dos criterios básicos para dividir el tamaño total entre los estratos: a) A cada estrato le corresponde igual número de elementos muéstrales. b) Proporcionalmente al tamaño relativo del estrato en la población. La distribución se hace de acuerdo con el peso (tamaño) de la población en cada estrato. Ejemplo de muestreo Estratificado b.3 Otro tipo de muestreo que se utiliza cuando los elementos de la población están ordenados en listas es el MUESTREO SISTEMATICO. Si la población tiene tamaño N, se desea una muestra de tamaño n. Sea k = entero más próximo a N/n. Se elige al azar un elemento entre los primeros k elementos de la lista → n1 es el orden elegido. Tomamos los elementos n1+k; n1+2k, etc., a intervalos fijos de k hasta completar la muestra. • Si el orden de los elementos en la lista es al azar, este procedimiento es equivalente al muestreo al azar o aleatorio. • Si el orden de los elementos es tal que los individuos próximos tienden a ser mas semejantes que los alejados, el muestreo sistemático tiende a ser más preciso que el muestreo al azar, al cubrir más homogéneamente toda la población. El muestreo sistemático puede utilizarse conjuntamente con el estratificado, para seleccionar la muestra dentro de cada estrato. Ejemplo de muestreo Sistemático b.4 Para poblaciones muy heterogéneas se utiliza el MUESTREO POLIETAPICO por Conglomerados: Por ejemplo para seleccionar una muestra de personas de S.S. de Jujuy podemos seleccionar por muestreo aleatorio simple barrios, después calles dentro de los barrios, luego viviendas de la calle y finalmente, el piso dentro de la vivienda, etc. MUESTERO ALEATORIO POR CONGLOMERADOS La unidad muestral ya no son los individuos, sino un conjunto de individuos que bajo determinados aspectos, se considera que forman una unidad. Busca, al contrario que el estratificado, heterogeneidad dentro de los estratos y homogeneidad entre estratos. En pequeña escala, cada conglomerado es una representación del universo. MUESTREO POLIETÁPICO POR CONGLOMERADOS Es un submuestreo del conglomerado. Se utiliza cuando el número de conglomerados es elevado. Selecciona los individuos por etapas, configurando sucesivamente grupos (estratos o conglomerados) y subgrupos denominados Unidades de Muestreo primarias, secundarias, terciarias, etc. Ejemplo de muestreo por Conglomerados La regla general que se aplica a todos los procedimientos de muestreo es que cualquier información previa debe utilizarse para subdividir la población y asegurar la mayor representatividad de la muestra. Una vez que disponemos de subpoblaciones homogéneas, la selección dentro de ellas debe realizarse por muestreo al azar. En todo lo que sigue SUPONDREMOS SIEMPRE que la muestra proviene de un muestreo al azar. Resumen Tipos de Muestreo MODELO PARA MUESTREO AL AZAR CON REPOSICION Por algún procedimiento práctico adecuado, se va a seleccionar al azar, con reposición a n familias y se va a preguntar a las respectivas familias sus ingresos totales, por ejemplo en el último año anterior al día del relevamiento. Familia 1 Familia 2 Familia 3 … Familia n-ésima Ingreso x1 Ingreso x2 Ingresox3 ... Ingreso xn x1, x2, ... , xn será una muestra al azar con reposición de ingresos ($) Si nuestro interés: El ingreso promedio de las 174.763 familias de la provincia de Jujuy), podemos tomar el ingreso promedio de las n familias entrevistadas n x x n 1i i (1) Evaluemos el verdadero valor y alcance de la medida (1). Si la selección hubiera recaído en otras n familias (lo que es completamente factible, pues la selección fue hecha "al azar"), ¿ x podría haber tomado un valor distinto? ¿Podrían haberse presentado valores muy alejados del que obtuvimos, de manera que por"pura casualidad" tengamos un valor excepcionalmente alto o bajo? Para analizar todas estas cuestiones, utilizamos el hecho básico de que la selección fue hecha al azar y utilizaremos algunas ideas de probabilidad y variables aleatorias. MODELO: Usemos la v.a. X para designar a la variable o característica que se quiere investigar. En el ejemplo: X es el “ingreso total de una unidad familiar” X tiene una distribución de frecuencias relativas, que muestra las proporciones de unidades familiares que tiene cada nivel de ingreso total. Si x es un valor de X → x es el ingreso de una unidad familiar. Si hay k familias con ingreso x → k/ 174.763 es la proporción de familias con ingreso x. LA POBLACION ES UNA VARIABLE ALEATORIA X QUE TIENE ALGUNA DISTRIBUCION DE FRECUENCIAS RELATIVAS (que sumen 1). Por cada valor de X distinto, se ponen en la urna tantas bolillas como veces ese valor aparezca en la población y tendremos una urna con bolillas en la misma proporción que la distribución de frecuencias relativas. Se extrae de esa población o urna, una muestra al azar de tamaño n= 1. Proposición Fundamental: Si designamos por X1 el valor que resultará seleccionado, X1 es una variable aleatoria cuya distribución de probabilidad es la distribución de frecuencias relativas de X. Conclusión: FX1(x1) = FX(x1). Por ejemplo P(X1 ≤ 10.000) = P(X ≤ 10.000) Si X2 registra el valor que resultará seleccionado en la segunda unidad muestral, X2 es una variable aleatoria con la misma distribución de X y es INDEPENDIENTE de X1. Conclusión: Si X1, X2,...,Xn son las variables aleatorias del muestreo al azar con reposición, entonces FX i = FX para cada i = 1, 2, …, n. Esto es P( X i ≤ a ) = P( X ≤ a ) Si X1, X2,...,Xn son variables aleatorias INDEPENDIENTES cada una con la distribución de probabilidad de X, definimos X1, X2,...,Xn como una MUESTRA ALEATORIA de variables aleatorias de la población X. MUESTREO AL AZAR SIN REPOSICION (SIMPLE) Hasta X1 es lo mismo que en el modelo anterior. Proposición: Si X1, X2,...,Xn son las variables aleatorias del muestreo sin reposición de una población de tamaño N > n, y X es la variable aleatoria de la población, entonces X1, X2,...,Xn tienen marginalmente la misma distribución de X pero no son independientes. (Es así pues X2 es el valor que resultará seleccionado y hasta tanto no salga seleccionado x1 la distribución de X2 será igual a la Distribución de X). Mientras que al censar conocemos toda la distribución de X, con el muestreo al azar obtenemos información probabilística sobre esa distribución pues cada Xi tiene la distribución de probabilidad de X. RESUMEN: En el muestreo al azar queremos distinguir entre los números que se observan al disponer de los datos x1, x2,..., xn y las variables aleatorias X1, X2, ... ,Xn que constituyen la CONTRAPARTE TEORICA de las observaciones. Con los números observados podemos hacer cálculos, gráficos etc., pero para aclarar el valor intrínseco de las observaciones, y para tener en cuenta que provienen de un muestreo al azar, recurrimos al análisis de las correspondientes variables aleatorias. 5.- NOTAS SOBRE MUESTREO AL AZAR Con reposición: teóricamente el más fácil, pues las observaciones X1, X2, ..., Xn son independientes en sentido probabilístico, e idénticamente distribuidas (tienen la distribución de la población). Sin reposición: Es el más eficiente, pues la información que da un elemento no aparece sino una sola vez. Si por ejemplo tuviésemos una población muy chica, el muestreo sin reposición rápidamente nos proporcionaría toda la información, mientras que el muestreo con reposición seguiría manteniendo ciertos niveles de probabilidad. Proposición: Aún en el caso del muestreo sin reposición, cada una de las observaciones X1, X2, ..., Xn tiene (marginalmente) la misma distribución que la población. Sin embargo las observaciones no son independientes en el sentido probabilístico. No demostraremos esta aseveración en general, sino que daremos un ejemplo para ver por qué se cumple. Ejemplo: Sea una urna con 100 bolillas de las cuales 20 están marcadas con el número uno, 30 con el dos y 50 con el tres. Analice el experimento aleatorio consistente en extraer dos bolillas al azar, con y sin reposición. La distribución de probabilidad de v.a. poblacional X “la puntuación de bolilla extraída” es: x P(X = x) 1 0,20 2 0,30 3 0,50 Las posibles muestras de tamaño 2 y sus respectivas probabilidades se presentan en la tabla siguiente: Caso A: Extracciones con reposición P(X1 = x1, X2 = x2 ) = P(X1 = x1)*P(X2 = x2 │ X1= x1)= P(X1 = x1)*P(X2 =x2 ) Caso B: Extracciones sin reposición P(X1 = x1, X2 = x2 ) = P(X1 = x1) P(X2 = x2 │ X1 = x1) Como 198/990 = 0,20, 297/990 = 0,30 y 495/990 = 0,50, en este caso resulta que marginalmente los acontecimientos “1”, “2” y “3” tienen las misma probabilidades en ambos casos. Note sin embargo que el cuerpo de las tablas es distinto y que en el caso sin reposición no hay independencia. 6.- NOTA SOBRE TERMINOLOGIA La dualidad entre los valores muestrales observados (xi ) y su contraparte teórica, las variables aleatorias Xi , hace que existan dos maneras de caracterizar a la mayoría de los elementos en juego. Presentamos ambas formas en el cuadro siguiente. D E F I N I C I O N E S Concepto En Muestreo En términos de variables aleatorias Población Conjunto de mediciones de una característica, para los individuos de un grupo bien definido. A menudo también la población física (personas, ratones, etc.) Variable aleatoria (X) y su distribución de probabilidad. (Nota: ver definición “alternativa” de v.a. en las notas – Claramente la variable poblacional X concuerda con esa definición, y es una v. a.) Muestra Subconjunto de la población Muestra al azar Conjunto de observaciones muestrales (Xi ), cada una es una variable aleatoria. Muestreo al azar Selección de una muestra con probabilidades conocidas Parámetro Cualquier característica mensurable de la población Parámetro (o función paramétrica) de la distribución de la variable aleatoria (cuando la v. a. tiene una distribución paramétrica). Estadístico Característica mensurable de la muestra Función de las variables aleatorias muestrales, y por lo tanto también una v. a. Parte 2 7.- EL CONCEPTO DE LA DISTRIBUCIÓN MUESTRAL DE UN ESTADÍSTICO Ya dijimos que estamos interesados en analizar el promedio observado n x x n i i 1 o la suma observada n i ix 1 , no como números dados sino tomados desde el punto de vista que las xi tienen como contraparte teórica las variables aleatorias Xi. Vale decir que queremos analizar como variables aleatorias a n X X n i i 1 , n i iX 1 , etc. Entonces en el marco de las variables aleatorias involucradas usamos la siguiente definición (2): Definición: Se llama ESTADISTICO a cualquier función de las variables aleatorias del muestreo y solo de ellas, y por lo tanto también es una variable aleatoria- U es un estadístico ↔ U = U (X1, X2, ..., Xn) Una primera observación es que estos estadísticos son también variables aleatorias, pues son transformaciones (simples o complicadas) de las variables aleatorias X1, X2, ..., Xn. Como además sabemos algo de la distribución de las Xi, podemos aspirar a analizar a los estadísticos (tomados como variables aleatorias) con mucho detalle. Por ejemplo, si el muestreo fue al azar con reposición, los Xi son independientes y tienen la distribución FX de la población X. Si el muestreo fue al azar sin reposición (al azar simple), los Xi tienen todavía marginalmente la misma distribución FX (de la población X), pero no son independientes. Ejemplo: Con o sin reposición, E X1+X2+ … + Xn n = E(X) , esto es E(x ) = E(X). Demostración:E(x ) = E X1+X2+ … + Xn n = 1 n E X1 + X2 + … + Xn = 1 n E X1) + E(X2) + … + E( Xn = 1 n n E(X) = E(X) Notas: (1) La reposición o falta de ella no afecta este resultado, pues la clave está en la “linealidad de la esperanza matemática”. (1) E X1 + X2 + … + Xn = n E X , depende de n; en consecuencia es un poco menos útil que el estadístico media aritmética, si bien en este caso ambos pueden sustituirse prácticamente para todos los fines. Por ser un estadístico una variable aleatoria tiene una distribución de probabilidad que se llama “Distribución muestral del estadístico”. Definición: Llamamos distribución muestral de un estadístico a su distribución de probabilidad cuando se lo considera una variable aleatoria. Ejemplos: Si x 1 , x 2 , ... , xn son los números obtenidos en el muestreo, todas las operaciones con esos números nos permiten definir estadísticos. x1+ x2+ … + xn= t —→ será un valor del estadístico T = X1 + X2 + ... + Xn x1+x2+ … + xn n = x —→ será un valor del estadístico x = X1+X2+ … + Xn n Entonces, desde un punto de vista teórico T y x son variables aleatorias cuyas distribuciones de probabilidad se llaman “Distribución Muestral de T” y “Distribución Muestral de x ”. Problemas típicos con respecto a la distribución muestral de un estadístico: (1) Problema amplio: Dada una cierta distribución de probabilidad de la población X, deducir la distribución muestral de un estadístico. (2) Problema reducido: Dada cierta información con respecto a la distribución de probabilidad de la población X, deducir algunas partes de la distribución muestral de un estadístico, e incluso decir algo sobre toda la distribución si fuera posible. Típicamente estos problemas son resueltos por la estadística matemática, los resultados se expresan en la forma siguiente: Si la v.a. poblacional X tiene una cierta distribución (específica) FX y U = U (X1, X2, ..., Xn) es un estadístico muestral función de las variables aleatorias Xi , y Xi se distribuye como X para cada subíndice i, entonces U tiene la distribución FX. En otros casos puede decirse: Si E(X) = , entonces x satisface E(x ) = . Esto es lo que demostramos más arriba 8.- OTROS ESTADÍSTICOS IMPORTANTES Si X1, X2, ..., Xn es una muestra aleatoria de v. a. (iid) son de interés, entre otros, los siguientes estadísticos ya estudiados en estadística descriptiva que miden donde se concentra la distribución muestral, su variabilidad, como así también posiciones no centrales de dicha distribución. x = X1+X2+ … + Xn n Media o promedio muestral x Mediana Muestral S2 = X i− X 2n i=1 n−1 Varianza muestral S = 𝑆2 Desviación estándar muestral K = Mín (X1, X2, ..., Xn) Mínimo de la muestra M = Máx (X1, X2, ..., Xn) Máximo de la muestra R = M – K Rango muestral Estadísticos de orden: 𝑋(𝑗 ) 𝑛 j-ésima observación de la muestra ordenada (en orden creciente) j = 1, 2, …, n 𝑋(1) 𝑛 ≤ 𝑋(2) 𝑛 ≤ 𝑋(3) 𝑛 ≤ … ≤ 𝑋(𝑛) 𝑛 Obviamente 𝑋(1) 𝑛 = 𝐾 𝑋(𝑛) 𝑛 = 𝑀 9.- EJEMPLO de la CONSTRUCCION DE LA DISTRIBUCION MUESTRAL DE UN ESTADISTICO (25/08) Para ilustrar los conceptos, consideremos una población extremadamente sencilla (la que seguramente no daría origen a un problema de muestreo en la vida real) que nos permite deducir la distribución muestral de algunos estadísticos en forma completa sin tener que resolver un problema matemático complicado. Las distribuciones muestrales pueden construirse empíricamente a partir de poblaciones finitas. Para ello se procede como sigue: 1.- De una población finita de tamaño N, se extraen al azar todas las muestras posibles de tamaño n. 2.-Se calcula el estadístico de interés para cada muestra. 3.-Se listan en una columna los distintos valores observados del estadístico, y en otra columna las frecuencias relativas correspondientes de cada valor observado. Problema: Sea una urna con 100 bolillas de las cuales 20 están marcadas con el número uno, 30 con el dos y 50 con el tres. Se extraen dos bolillas al azar con reposición. Determine: a) Distribución de probabilidad, esperanza y varianza de la población. b) Distribución de probabilidad de la muestra. a) Distribución de probabilidad, esperanza y varianza de la media muestral y de la varianza muestral. Solución: a) Denominando X a la puntuación de la bolilla extraída, la distribución de probabilidad de X es x pX(x) 1 0,2 2 0,3 3 0,5 Calculamos su esperanza y varianza. E(X) = = 2,3 V(X) = 2 = 0,61 a) Las posibles muestras seleccionadas al azar, con reposición y sus respectivas probabilidades fueron calculadas en el ejemplo del punto 4) Tabla A (Probabilidades Conjuntas de X1, X2) b) Veamos a continuación el valor de la media y la varianza para cada posible muestra: Muestra (x1, x2) x s2 P(X1= x1, X2= x2) (1,1) 1 0 0,04 (1,2) 1,5 0,5 0,06 (1,3) 2 2 0,10 (2,1) 1,5 0,5 0,06 (2,2) 2 0 0,09 (2,3) 2,5 0,5 0,15 (3,1) 2 2 0,10 (3,2) 2,5 0,5 0,15 (3,3) 3 0 0,25 Por lo tanto las distribuciones de probabilidad de la media muestral y de la varianza muestral son: x P( X = x ) 1 P{(1,1)} = 0,04 1,5 P{(1,2), (2,1)}= 0,06 + 0,06 = 0,12 2 P{(1,3), (2,2), (3,1)}= 0,10 + 0,09 + 0,10 = 0,29 2,5 P{(2,3), (3,2)}= 0,15 + 0,15 =0,30 3 P{(3,3)} = 0,25 E(X ) = 1∙ 0,04 + 1,5 ∙ 0,12 + 2∙ 0,29 +2,5 ∙ 0,30 + 3 ∙ 0,25 = 2,3 = E(X) E(X 2 ) = 12∙ 0,04 + 1,52 ∙ 0,12 + 22∙ 0,29 +2,52 ∙ 0,30 + 32 ∙ 0,25 = 5,59 V(X ) = 5,59 – 2,32 = 0,305 = σ2 n = 0,61 2 s2 P(S 2 = s2) 0 P{(1,1), (2,2), (3,3)}= 0,04+0,09+0,25 = 0,38 0,5 P{(1,2), (2,1), (2,3), (3,2)}= 0,06 + 0,06 + 0,15 + 0,15 = 0,42 2 P{(1,3), (3,1)}= 0,10 + 0,10 = 0,20 E(S2) = 0∙ 0,38 + 0,5 ∙ 0,42 + 2∙ 0,20 = 0,61 = V(X) E(S2 ) = 02∙ 0,38 + 0,52 ∙ 0,42 + 22∙ 0,20 = 0,905 V(S2) = 0,905 – 0,612 = 0,5329 El problema central de la estadística inferencial consiste en utilizar la información disponible sobre distribuciones como las de X y S2 del ejemplo, para emitir juicios respecto a (la distribución) de la población. Nótese que la distribución muestral de un estadístico depende de la distribución de la población, por supuesto de la fórmula definitoria del estadístico y del proceso de muestreo incluso el tamaño muestral. Si el muestreo hubiera sido sin reposición, las distribuciones podrían haber sido diferentes, por ejemplo. Estas consideraciones son válidas para la mayoría de las distribuciones muestrales. El alumno debe tener en cuenta que en la realidad la población nunca es conocida en forma completa, no es razonable suponer que sea tan elemental como en el ejemplo. Además debe reconocer que en la mayoría de los casos útiles no es posible deducir la distribución muestral enumerando los casos, como hicimos en el ejemplo. 10. MOMENTOS DE ALGUNAS DISTRIBUCIONES MUESTRALES Normalmente, para una distribución muestral, se tiene interés en conocer tres cosas: media, varianza y forma funcional. Es bien conocida la dificultad que existe para elaborar una distribución muestral de acuerdo al procedimiento anterior cuando la población es muy grande. También constituye un problema cuando la población es infinita. En este caso lo mejor que se puede hacer es aproximar la distribución del muestreo para el estadístico. Ambos problemas pueden evitarse por medio de la matemática El problema que tratamos es el siguiente: Sea X1, X2, … , Xn una muestra al azar de una variable aleatoria (población) X con distribución acumulada FX. Sea U = U (X1, X2, … , Xn) un estadístico, función solo de las observaciones muestrales (no depende de parámetros poblacionales, por ejemplo). Queremos encontrar momentos de U, esto es, momentos de la distribución muestral de U. Por ejemplo queremos saber que son E(U), E[U – E(U)]2 = Var(U), etc.Consideramos algunos casos particulares: 10.1 Para el Caso de Muestreo al Azar Con Reposición de una población X con E(X)= , Var(X) = 2 Momentos de X 1°) E(X ) = E(X) = Demostración: E(𝑋 ) = 𝐸 𝑋1+𝑋2+ … + 𝑋𝑛 𝑛 = 1 𝑛 𝐸 𝑋1 + 𝑋2 + … + 𝑋𝑛 = 1 𝑛 𝐸 𝑋1) + 𝐸(𝑋2) + … + 𝐸( 𝑋𝑛 = 1 𝑛 𝑛 = 𝐸(𝑋) Notas: (1) La reposición o falta de ella no afecta este resultado, pues la clave está en la “linealidad de la esperanza matemática”. 2°) V(X ) = V(X) n = σ2 n pues las variables son X1, X2, … , Xn son independientes por ser el muestreo con reposición. Demostración: V(𝑋 ) = E [𝑋 - E(𝑋 )]2 = E [𝑋 – ]2 = E 𝑋𝑖 𝑛 𝑖=1 𝑛 − 𝜇 2 = E 𝑋𝑖 𝑛 𝑖=1 𝑛 − 𝑛𝜇 𝑛 2 = E 𝑋𝑖 𝑛 𝑖=1 𝑛 − 𝜇𝑛𝑖=1 𝑛 2 = 1 𝑛2 E (𝑋𝑖 𝑛 𝑖=1 − 𝜇) 2 = 1 𝑛2 E (𝑋𝑖 𝑛 𝑖=1 − 𝜇) (𝑋𝑗 𝑛 𝑗=1 − 𝜇) = 1 𝑛2 E (𝑋𝑖 𝑛 𝑗=1 − 𝜇) 𝑛 𝑖=1 (𝑋𝑗 − 𝜇) = 1 𝑛2 𝐸 𝑋𝑖 − 𝜇 𝑋𝑗 − 𝜇 𝑛 𝑗=1 𝑛 𝑖=1 = 1 𝑛2 (𝑋𝑖 𝑛 𝑖=1 −𝜇) 2 + 𝐸 𝑋𝑖 − 𝜇 𝑋𝑗 − 𝜇 𝑛 𝑗=1 𝑛 𝑖=1 iǂj = 1 𝑛2 𝑉 𝑋𝑖 𝑛 𝑖=1 + 𝐶𝑜𝑣 (𝑋𝑖 ,𝑋𝑗 ) 𝑛 𝑗=1 𝑛 𝑖=1 𝐶𝑜𝑣 𝑋𝑖 ,𝑋𝑗 = 0 por ser las Xi independientes iǂj = 1 𝑛2 𝑛 𝜎2 = 𝜎2 𝑛 Momentos de S2 S2 = X i− X 2n i=1 n−1 1°) E(S2 ) = 2 2°) Si X es normal, V(S2) = 2σ4 n−1 Momentos de S’2 S’2 = X i− X 2n i=1 n 1°) E(S’2 ) = n−1 n 2 2°) Si X es normal, V(S′2) = n−1 n 2σ4 n 10.2 Para el Caso de Muestreo “Simple al Azar” (Sin Reposición) de una Población Finita X Los momentos de estadísticos presentados, corresponden al caso en que se muestrea con reposición. Esto es equivalente a considerar una población infinitamente grande, en el sentido de que no se altera por la extracción de una muestra de tamaño n, finito. Un caso distinto ocurre cuando la población es finita, de tamaño N, y extraemos una muestra al azar simple, esto es sin reposición. Ya vimos que en este caso las observaciones muestrales Xi siguen teniendo marginalmente la misma distribución que X, pero que son dependientes. En consecuencia cuando calculemos momentos es necesario tener en cuenta este hecho; por ejemplo el cálculo de la varianza de X que reproducimos más arriba, no es válido cuando las Xi no son independientes. Parámetros 𝜇 = 𝐸 𝑋 = 1 𝑁 𝑋𝑗 𝑁 𝑗=1 𝜎2 = 𝑉 𝑋 = 1 𝑁 (𝑋𝑗 − 𝜇) 2 = 𝐸 𝑋 − 𝐸(𝑋) 2𝑁𝑗=1 Momentos de X 1°) E(X ) = . Demostrado en 9.1 2°) V(X ) = V(X) n = σ2 n N−n N−1 . El factor N−n N−1 es efecto de la dependencia y se llama factor de corrección por población finita (cpf) N−n N−1 puede omitirse cuando el tamaño de la muestra es pequeño en comparación con el tamaño de la población. Criterio: La mayoría de los estadísticos no utilizan el cpf a menos que la muestra contenga más del 5% de las observaciones de la población. O sea se ignora el cpf si n N ≤ 0,05 Ejemplo: Una muestra de tamaño 100 de una población de tamaño N= 100.000 unidades tiene la misma precisión que una muestra de tamaño 100 de una población de tamaño N = 100.000.000 n = 100, N = 100.000 V(X )= σ2 n 100000−100 100000−1 = 99900 99999 σ2 n = 0,99900999 σ2 n n = 100, N = 100.000.000 V(X )= σ2 n 100000000 −100 100000000 −1 = 99999900 99999999 σ2 n = 0,99900001 σ2 n Notaciones : Para el valor esperado de X : E(X ) o μX Para la varianza de X : V (X ) o σX 2 DISTRIBUCION MUESTRAL DE ALGUNOS ESTADISTICOS 11.- DISTRIBUCION MUESTRAL DE LA MEDIA MUESTRAL 𝑋 = 𝑋1+𝑋2+ … + 𝑋𝑛 𝑛 y/o del Total T= 𝑋1 + 𝑋2 + … + 𝑋𝑛 Reconsideramos los teoremas estudiados en Combinaciones Lineales de variables aleatorias a la luz de la teoría de Muestreo. 11.1 Muestreo de poblaciones normales (Teorema 13 de Combinaciones Lineales) Sea X1, X2, … , Xn una muestra aleatoria de una población X con distribución normal con media y varianza 2, entonces con cualquier tamaño de muestra n, 𝑋 está normalmente distribuida (con media y varianza 2/n), al igual que el total T (con media n y varianza n 2). Esto es 𝑋 ~ N 𝜇𝑋 = 𝜇 , 𝜎𝑋 2 = 𝜎2 𝑛 T ~ N 𝜇𝑇 = 𝑛 𝜇 , 𝜎𝑇 2 = 𝑛 𝜎2 Ejemplo 𝑋 : La duración de cierto tipo de baterías está normalmente distribuida con media de 8 horas y desviación estándar de 1 hora. a) Si se escoge aleatoriamente una batería, ¿cuál es la probabilidad de que dure por lo menos 8,5 horas? b) Si las baterías se venden en paquetes de 4 baterías. ¿Cuál es la probabilidad de que la duración promedio de las 4 baterías, de un paquete seleccionado, sea por lo menos de 8,5 horas? Ejemplo T: Un elevador de carga grande puede transportar un máximo de 10.000 libras (5 toneladas). Suponga que una carga que contiene 45 cajas se debe transportar mediante el elevador. La experiencia ha demostrado que el peso X de una caja de este tipo de carga se ajusta a una distribución de probabilidad con una media de = 200 libras y una desviación estándar de = 55 libras. ¿Qué probabilidad hay de que las 45 cajas se puedan cargar en el elevador de carga y transportarse simultáneamente? 11.2 Muestreo de una población Bernoullí (Teoremas 10 y 11 de Combinaciones Lineales) Sea X1, X2, … , Xn una muestra aleatoria de una población X con distribución Bernoullí entonces Distribución muestral del total de éxitos de la muestra T= 𝑋1 + 𝑋2 + … + 𝑋𝑛 ; T tiene distribución binomial con parámetros n y p, T representa el número de éxitos en la muestra de tamaño n Distribución Muestral de la Proporción Muestral PS 𝑋 = 𝑇 𝑛 = 𝑋1+𝑋2+ … + 𝑋𝑛 𝑛 (=PS) tiene distribución binomial de proporciones PS representa la proporción de éxitos en la muestra Ejemplo: Se toma una muestra de 250 casas de una población de edificios antiguos para estimar la proporción de casas de este tipo. Supongamos que el 30% de todos los edificios son antiguos. Hallar la probabilidad de que la proporción de edificios antiguos esté entre 0.25 y 0.35. n*p y n*q ambos ≥5 E(PS)= p VAR(PS)= 𝑝∗𝑞 𝑛 Factor de corrección por continuidad 𝑃(𝑎 − 1 2 ∗ 𝑛 ≤ 𝑃 ≤ 𝑏 + 1 2 ∗ 𝑛 ) 11.3 Muestreo de una población X de cualquier forma funcional (Teorema Central del Límite) Dada una población X de cualquier forma funcional con una media y varianza 2 finita y sea X1, X2, … , Xn una muestra aleatoria de esa población. Si n es suficientemente grande 𝑋 tiene aproximadamente distribución Normal. Esto es Si n es grande, 𝑋 ~ N 𝜇𝑋 = 𝜇 , 𝜎𝑋 2 = 𝜎2 𝑛 ¿Qué tan grande debe ser la muestra para que el TCL sea aplicable? Regla empírica: En la mayoría de las aplicaciones prácticas una muestra de tamaño 30 es suficiente. En general, la aproximación a la normalidad de 𝑋 mejora a medida que crece el tamaño de la muestra. 12.- Distribución Muestral de la diferencia entre dos medias muestrales 𝑿 − 𝒀 Si se extraen al azar muestras independientes de tamaños n1 y n2 de dos poblaciones, discretas o continuas, con medias μ1 y μ2 y varianzas σ12 y σ22, respectivamente, entonces la distribución muestral de las diferencias de las medias muestrales 𝐗 − 𝐘 , tendrá las siguientes propiedades: 1°) 𝜇𝑋 −𝑌 = E(𝑋 − 𝑌 )= E(𝑋 ) − 𝐸(𝑌 )= μ1 —μ2 𝜎𝑋 −𝑌 2 = 𝑉 𝑋 − 𝑌 = 𝑉 𝑋 ) + 𝑉(𝑌 = 𝜎1 2 𝑛1 + 𝜎2 2 𝑛2 2°) Si ambas poblaciones son normales, X ~ N(μ1, σ12) e Y ~ N(μ2 , σ22 ) Entonces 𝑋 ~ N 𝜇1 , 𝜎1 2 𝑛1 e 𝑌 ~ N 𝜇2 , 𝜎2 2 𝑛2 Luego 𝑋 − 𝑌 ~ N 𝜇1 —𝜇2 , 𝜎1 2 𝑛1 + 𝜎2 2 𝑛2Entonces la diferencia tiene una distribución normal exacta sin importar los tamaños de las muestras n1 y n2. 3°) Si las poblaciones no son normales, entonces si n1 y n2 son suficientemente grandes 𝑋 − 𝑌 ~ aproximadamente N 𝜇1 —𝜇2 , 𝜎1 2 𝑛1 + 𝜎2 2 𝑛2 si n1 ≥ 30 y n2 ≥ 30 Teorema : Si se extraen al azar muestras independientes de tamaños n1 y n2 de dos poblaciones, discretas o continuas, con medias μ1 y μ2 y varianzas σ12 y σ22, respectivamente, entonces la distribución muestral de las diferencias de las medias muestrales , está distribuida aproximadamente de forma normal con media y varianzas dadas por E(𝑋 − 𝑌 )= μ1 —μ2 ; 𝑉 𝑋 − 𝑌 = 𝜎1 2 𝑛1 + 𝜎2 2 𝑛2 De aquí 𝑍 = 𝑋 −𝑌 −(𝜇1 —𝜇2) 𝜎1 2 𝑛1 +𝜎2 2 𝑛2 es aproximadamente una variable normal estándar. •Si n1 y n2 son mayores o iguales a 30, la aproximación normal para la diferencia de 𝑋 − 𝑌 es muy buena sin importar las formas de las dos poblaciones. Sin embargo, aun cuando n1 y n2 sean menores que 30, la aproximación normal es razonablemente buena excepto cuando las dos poblaciones no son definitivamente normales. •Por supuesto, si ambas poblaciones son normales, entonces la diferencia 𝑋 − 𝑌 tiene una distribución normal exacta sin importar los tamaños de las muestras n1 y n2. Ejemplo: En una población de bovinos de la sierra central, la producción de leche promedio es de 12 litros con una desviación estándar de 4 litros. En otra población de bovinos de la sierra sur la producción promedio es de 10 litros con una desviación estándar de 3 litros. Si se obtiene una muestra aleatoria simple de 24 bovinos de la sierra central y otra de 30 de la sierra sur ¿cuál es la probabilidad de que la media muestral para la muestra aleatoria de la sierra central exceda a la de la sierra sur en más de 2 litros. 13.- Distribución Muestral de la Varianza muestral S2 Sea X1, X2, … , Xn una muestra aleatoria de una población X con distribución normal con media y varianza 2 y sea S2 la varianza muestral S2 = X i− X 2n i=1 n−1 Entonces se tiene lo siguiente a) E(S2 ) = 2 b) Si 𝑋 ~ 𝑁(𝜇,𝜎2), entonces 𝑛−1 𝑆2 𝜎2 tiene una distribución chi- cuadrado con n – 1 grados de libertad y V(S2) = 2𝜎4 𝑛−1 Demostración a) 𝑋𝑖 − 𝑋 2 = 𝑋𝑖 − 𝜇 + 𝜇 − 𝑋 2 =𝑛𝑖=1 𝑛 𝑖=1 [ 𝑋𝑖 − 𝜇 + 𝜇 − 𝑋 ] 2 𝑛𝑖=1 = (𝑋𝑖 − 𝜇) 2 + 2(𝑋𝑖 − 𝜇) 𝜇 − 𝑋 + 𝜇 − 𝑋 2 𝑛𝑖=1 = (𝑋𝑖 − 𝜇) 2𝑛 𝑖=1 + 2 𝜇 − 𝑋 𝑋𝑖 − 𝜇 + 𝜇 − 𝑛 𝑖=1 𝑛 𝑖=1 𝑋 2 = (𝑋𝑖 − 𝜇) 2𝑛 𝑖=1 + 2 𝜇 − 𝑋 𝑛 𝑋 − 𝜇 +n 𝑋 − 𝜇 2 = (𝑋𝑖 − 𝜇) 2𝑛 𝑖=1 − 𝑛 𝑋 − 𝜇 2 Entonces 𝐸 𝑆2 = 𝐸 X i− X 2n i=1 n−1 = 1 𝑛−1 𝐸 𝑋𝑖 − 𝜇 2𝑛 𝑖=1 − 𝑛 𝑋 − 𝜇 2 = 1 𝑛−1 𝐸 𝑋𝑖 − 𝜇 2𝑛 𝑖=1 − 𝑛 𝐸 𝑋 − 𝜇 2 = 1 𝑛−1 𝑉 𝑋𝑖 𝑛 𝑖=1 − 𝑛 𝑉 𝑋 = 1 𝑛−1 𝑛𝜎2 − 𝑛 𝜎2 𝑛 = 𝑛−1 𝑛−1 𝜎2 = 𝜎2 Ejemplo: El tiempo que ocupan los estudiantes mirando televisión en las semanas anteriores a los exámenes finales (en horas) tiene una distribución normal con desvió estándar de 4,5 hs. Se tomó una muestra de 30 estudiantes: Indique si la probabilidad de que el desvío estándar muestral supere las 3,5 hs es mayor a 0,95. 14.- Distribución Muestral de la razón de 2 varianzas muestrales 𝑺𝟏 𝟐 𝑺𝟐 𝟐 Un problema que surge en los experimentos industriales es comparar la variabilidad de dos procesos 𝜎1 2 𝜎2 2 Se toma una muestra al azar con reposición de n1 artículos, usando el proceso X y se toma una muestra aleatoria de n2 artículos, usando el proceso Y. se comparan las varianzas muestrales para cada proceso, o sea 𝑆1 2 𝑆2 2 . Si esta razón es cercana a la unidad, las variabilidades se juzgan como casi equivalentes; si esta razón es muy diferente a la unidad, las variabilidades se juzgan como no equivalentes. Para tomar buenas decisiones y para cuantificar la expresión de “cercana a la unidad”, es necesario examinar la distribución de 𝑆1 2 𝑆2 2 Sea 𝑋1 , 𝑋2 ,… ,𝑋𝑛1 una muestra aleatoria de n1 v. a. independientes de una población normal X ~ N(μ1, σ12) y sea 𝑌1 , 𝑌2 ,… ,𝑌𝑛2 una muestra aleatoria de n2 v. a. independientes de una población normal Y ~ N(μ2 , σ22 ); además sean todas las X’s e Y´s independientes.χ1 La distribución de 𝜒1 2 = 𝑛1−1 𝑆1 2 𝜎1 2 es entonces chi- cuadrado con n1 – 1 grados de libertad. De modo similar 𝜒2 2 = 𝑛2−1 𝑆2 2 𝜎2 2 es también chi- cuadrado con n2 – 1 grados de libertad. Además estas dos variables 𝜒1 2 y 𝜒2 2 son independientes porque las X’s y las Y´s lo son. Entonces la variable aleatoria 𝐹 = 𝜒1 2 𝑛1−1 𝜒2 2 𝑛2−1 = 𝑛1−1 𝑆1 2 𝜎1 2 𝑛1−1 𝑛2−1 𝑆2 2 𝜎2 2 𝑛2−1 = 𝑆1 2 𝜎1 2 𝑆2 2 𝜎2 2 tiene una distribución F con n1 – 1 y n2 – 1 grados de libertad. • BIBLIOGRAFÍA: ELEMENTOS DE LA TEORIA DEL MUESTREO (Versión Preliminar)- Dr. Raúl Pedro MENTZ - Instituto de Investigaciones Estadísticas (INIE) - Universidad Nacional de Tucumán
Compartir