Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
muestral muestrales. - Una representa la forma de las cosas con respecto a un aleatorio en particular, que puede identificarse a de una medible X. - La manera en que ocurren las cosas en con X puede definirse por un modelo de probabilidad que recibe el nombre de de probabilidad de la . 2 Los en las cartas de una baraja. Las estaturas de los residentes de una ciudad. Las longitudes de los peces en un lago . finita Las observaciones obtenidas al medir diariamente la desde el pasado hasta el futuro. Las mediciones de la profundidad de un lago desde cualquier . infinita 3 Cada en una es un valor de una variable aleatoria tiene alguna de probabilidad 4 Ejemplos Si se inspeccionan que salen de una de ensamble para buscar defectos, entonces cada en la ser un valor 0 o 1 de la variable aleatoria de Bernoulli con una de probabilidad p(x) = P(X = x) = px(1 p)1 x con x {0, 1} donde 0 indica un articulo sin defecto y 1 indica un articulo defectuoso. De hecho, se supone que , la probabilidad de que cualquier articulo este defectuoso, permanece constante de una prueba a otra. Las duraciones de las de almacenamiento son valores que toma una variable aleatoria continua que tiene una normal. 5 De ahora en adelante, cuando nos refiramos a una a una o, en general, a la a una cuyas observaciones son valores de una variable aleatoria que tiene una binomial, una normal o la de probabilidad 6 Interesa llegar a conclusiones respecto a una cuando es imposible o poco conocer todo el conjunto de observaciones que la constituyen Al intentar controlar la cantidad de los componente activos en probarlos todos si tenemos que dejar algunas para venderlos. Los costos desmesurados que hacerlo. Realizar un muestreo a fin de considerar un subconjunto de observaciones de la que nos ayude a realizar inferencias respecto a ella. 7 Muestra Es un subconjunto de una . Para que las inferencias que hacemos sobre la a partir de la muestra sean , debemos obtener muestras que sean representativas de ella. Cualquier procedimiento de muestreo que produzca inferencias que sobreestimen o subestimen de forma consistente alguna de la sesgado. Para eliminar cualquier posibilidad de sesgo en el procedimiento de muestreo es deseable elegir una muestra aleatoria, lo cual significa que las observaciones se realicen de forma independiente y al azar. 8 : Sea X1, X2, , Xn de n variables aleatorias. Se dice que forman una muestra aleatoria de n si satisfacen: Las Xi son v. a. independientes Las Xi tienen la misma de . Si se cumplen 1) y 2) entonces se dice que las Xi son variables aleatorias independientes e distribuidas (iid) 9 10 : Cualquier de las variables aleatorias que forman una muestra aleatoria se llama . 11 Muestrales Como un es una variable aleatoria que depende solo de la muestra observada, debe tener una de probabilidad. : La de probabilidad de un se denomina muestral. La muestral de un depende de la de la del de las muestras y del de de las muestras. 12 muestral 13 14 CENTRAL 15 Como mostramos una variable que presenta valores distribuidos de forma muy . Claramente no normal. Saquemos muestras de usemos la media de cada muestra para estimar la 16 Cada muestra ofrece un resultado diferente: La media muestral es variable aleatoria. a la normal que la original. menos dispersa. A su . del estimador media se le suele denominar error . 17 Al aumentar el n, de la muestra: La normalidad de las estimaciones mejora El disminuye. 18 Puedo garantizar medias muestrales tan cercanas como quiera a la verdadera media, sin que tomar n bastante grande 19 Dada una v.a. cualquiera, si extraemos muestras de n, y calculamos los promedios muestrales, entonces: dichos promedios tienen aproximadamente normal; La media de los promedios muestrales es la misma que la de la variable original. La de los promedios disminuye en un factor de n (error ). Las aproximaciones anteriores se hacen exactas cuando n tiende a infinito. Este teorema justifica la importancia de la normal. Sea lo que sea lo que midamos, cuando se promedie sobre una muestra grande (n>30) nos va a aparecer de manera natural la normal. 20 Cuando queramos hacer inferencia la normal aparece de forma casi inevitable. Dependiendo del problema, podemos encontrar otras (asociadas): 2 (chi cuadrado) t- student Estas distribuciones resultan directamente de operar con distribuciones normales. aparecen como distribuciones de ciertos . 21 22 La curva que genera la variable aleatoria, es a la derecha, como se puede ver en las siguientes : La esperanza es n, y la varianza es 2n. n=6 n=10 23 24 Para el de probabilidades es preciso recurrir a tablas que, al igual que en el caso de la N(0;1), proporcionan valores aproximados. La forma de la t-Student es semejante a la normal pero achatada, campaniforme, con media cero (0), pero con mayor probabilidad de obtener valores extremos. Es bueno notar, que a medida que el de la muestra ( ) crece, la curva t-Student se normaliza. 25 26 Sean X1, X2,..., Xn variables aleatorias independientes normales con media y . Sean y Entonces la variable aleatoria tiene una con 1 grados de libertad. 27 n 1 grados de libertad se debe a que la media muestral es el promedio de n variables muestrales, La media muestral tiene la propiedad de que la suma de todos los valores de los datos debe ser igual a n veces la media muestral, donde n es el de valores en el conjunto de datos. Debido a esta lineal las con i =1, .., n son conjuntamente no independientes. n 1 variables aleatorias son independientes y libremente. La de la n- variable se determina para satisfacer la igualdad anterior. Por ejemplo, si el conjunto de datos tiene 10 valores, la suma de los 10 valores debe ser igual a la media x 10. Si la media de los 10 valores es 3.5, esta requiere que la suma de los 10 valores debe ser igual a 10 x 3.5 = 35. Con esa el primer valor del conjunto de datos libremente. Independientemente del valor que sea, es posible que la suma de los 10 tenga un valor de 35. El segundo valor libremente, debido a que independientemente del valor que escoja, aun permite la posibilidad de que la suma de todos los valores sea 35. De hecho, los primeros 9 valores pueden ser cualquier incluyendo los 2 ejemplos siguientes: 34, -8.3, -37, -92, -1, 0, 1, -22, 99 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9 Pero para que los 10 valores sumen 35 y tengan una media de 3.5, el 10mo valor no puede variar. Debe ser un : 34, -8.3, -37, -92, -1, 0, 1, -22, 99 -----> El 10mo valor ser 61.3 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9 ----> El 10mo valor ser 30.5 MUESTRAL Sea X1, X2, , Xn una muestra aleatoria. Si no conocemos la de la no podemos, en general, calcular la de los pero se en cualquier caso, determinar la esperanza y varianza (llamados valores previstos) de los principales en de los de la de la . Pueden presentarse los siguientes casos: 1. que la muestra aleatoria se elija con reemplazo y sea . Los valores previstos se calculan de la siguiente manera: donde E(X) y D2(X) son poblacionales 30 2. que la muestra aleatoria se elija sin reemplazo y sea . Los valores previstos se calculan de la siguiente manera: 2 n,N es X 2 31 A partir de ahora supondremos que la tiene una normal, ya que los resultados que vamos a obtener por el Teorema Central del lo requieren. Si ni lo tuviera una cuando la muestra que tomemos sea de grande. Sea X1, X2 Xn una muestra aleatoria tales que Entonces, (Nota: puede asumir cualquier valor, no necesariamente debe ser grande, pues la muestra proviene de una normal). 32 Dada una finita de N,formada por elementos de dos clases, N1 de la clase 1 y N2 de la clase 2 (o sea N1 + N2 = N). Se toma una muestra de n e interesa el de elementos de la clase 1 presentes en la muestra (dicho llamaremos de . Definimos una variable aleatoria X que indica el de elementos de la clase 1 presentes en la muestra, o sea indica el de . Llamaremos poblacional de a ) Llamaremos muestral de a Los valores posibles de son Si queremos calcular: 33 ; 34 (n 100 DeMoivre-Laplace. n qp p; N n p 35 muestral Si se extrae una muestra aleatoria de de una normal con media (desconocida) y varianza 2, y se calcula la cuasivarianza muestral, se obtiene un valor del . Tenemos que: De donde: Dividiendo ambos miembros por obtenemos: Entonces: son variables aleatorias estandarizadas, con i =1, ,n Todas tienen una normal ya que se distribuyen normalmente. Son independientes debido al muestreo aleatorio simple. es la suma de cuadrados de variables aleatorias normales independientes. : Sea X1; X2; ; Xn una muestra aleatoria con media y varianza 2, ENTONCES el tiene 2 con (n 1) grados de libertad.
Compartir