Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Apuntes preparados por el profesor Sr. Rosamel Sáez Estadística con fines de docencia Gráfico de caja y bigotes o Box-plot Antes de realizar un análisis de los datos, debemos preocuparnos que estos se encuentren libres de error, puesto que de existir, afectarían nuestros resultados y de esta forma también la toma de decisiones. Una aplicación importante de los cuartiles es construir un gráfico, llamado gráfico de caja y bigote, en el que se puede observar estadísticamente si la totalidad de los datos que entran a un proceso son válidos o si, se presentan valores anómalos o atípicos (outliers). El gráfico, también nos da una idea acerca de la simetría de la distribución, como también nos permite observar la dispersión de la variable en estudio. Para dibujar el box plot se siguen los siguientes pasos: i) Calcular los valores Q1, Q2, Q3, RI, Lo, L1, L2 y L3 donde: RI= Q3 - Q1 (rango intercuartilico). L0 = Q1 – 3RI L1 = Q1 – 1,5RI L2 = Q3 +1,5RI L3 = Q3 + 3RI ii) Dibujar una caja de ancho arbitrario que va desde Q1 hasta Q3 con una línea de división en Q2. iii) Dibuje el bigote. Ubique la observación más cercana a L2 dentro del intervalo (Q3 , L2), marque la observación con x y una a la caja mediante una línea. Ubique la observación más cercana a L1 dentro del intervalo (L1 , Q1), marque la observación con x y una a la caja mediante una línea. IV) Ubique observaciones dentro del intervalo (L0 , L1) o (L2 , L3). Marque estas observaciones con *. Estas serán llamadas posibles datos atípicos. V) Ubique observaciones sobre el valor L3 o bajo el valor L0. Marque estas observaciones con o. Estas serán llamadas datos atípicos. q1 q2 q3L0 L1 L2 L3 xx *** ooo Observaciones: 1.- En muchos gráficos el bigote coincide con los valores extremos. 2.- En algunos gráficos Q1 y Q2 son iguales o Q2 y Q3 son iguales. 3.- Si existen valores atípicos debe agotarse toda posibilidad para corregirlos, en caso contrario se recomienda que sean sacados del análisis ya que pueden causar ruido en las conclusiones. 4.- El Box-plot también es usado para comparar grupos. 22 Apuntes preparados por el profesor Sr. Rosamel Sáez Estadística con fines de docencia Ejemplo: Se realizó un experimento para comparar las cualidades de desgaste de tres tipos de pintura sometida a la acción abrasiva de una rueda forrada con tela que gira lentamente. Se probaron 10 muestras de cada tipo de pintura y se registró el número de horas transcurridas antes de la aparición de una abrasión visible en cada uno. Los datos se muestran en la tabla siguiente. Tipo pintura 1 2 3 148 76 393 520 236 134 55 166 415 153 513 264 433 94 535 327 214 135 280 304 335 643 216 536 128 723 258 380 594 465 Realizar un gráfico de Box-plot. P in t 1 P in t 2 P in t 3 P in t 2 1 .6 0 2 0 5 .3 0 3 8 9 .0 0 5 7 2 .7 0 7 5 6 .4 0 H or as B o x - p lo t Comente 23 Apuntes preparados por el profesor Sr. Rosamel Sáez Estadística con fines de docencia Variables Bidimensionales. Anteriormente aprendimos cómo a partir de una gran cantidad de datos que describen una única variable X, estos pueden ser resumidos en una tabla de distribución de frecuencias para así entender la forma de su distribución, también representamos gráficamente los mismos de modo que resulta más intuitivo hacerse una idea de como se distribuyen las observaciones. Otros conceptos que hemos visto, que también nos ayudan en el análisis, son los estadísticos de tendencia central, que nos indican hacia donde tienden a agruparse los datos (en el caso en que lo hagan), y los estadísticos de dispersión, que nos indican si las diferentes modalidades que presenta la variable están muy agrupadas alrededor de cierto valor central, o si por el contrario las variaciones que presentan las modalidades con respecto al valor central son grandes. También sabemos determinar ya si los datos se distribuyen de forma simétrica o presentan algún sesgo. En esta unidad estudiaremos una situación muy general y por tanto de gran interés en la práctica: Sea Y otra variable definida sobre la misma población que X, ¿será posible determinar si existe alguna relación entre las modalidades de X e Y? Por ejemplo, sea X una variable que representa la cantidad de unidades vendidas e Y el precio de un cierto producto. La relación más simple que podemos encontrar entre X e Y es una relación determinística del tipo Y=a+bX, sin embargo en casos reales este modelo no es realista y por lo general el modelo es del tipo Y=a+bX+ε , donde ε es un error. Otra forma de estudiar la relación entre las variables X e Y es registrando sus valores en una tabla de doble entrada o tabla de contingencia. Consideremos un conjunto de n objetos donde cada uno de ellos presenta dos características de interés X e Y. Sean x1, x2, ..., xr los r valores de una variable X e y1, y2, ..., yc los c valores de una variable Y. La información conjunta puede ser reunida en una tabla con la siguiente estructura: Y X \ y1 y2 ... yj ... yc Total fila x1 n11 n12 n1j n1c n1. x2 n21 n22 n2j n2c n2. M xi ni1 ni2 nij nic ni. M xr nr1 nr2 nrj nrc nr. Total columna n.1 n.2 n.j n.c n.. 24 Apuntes preparados por el profesor Sr. Rosamel Sáez Estadística con fines de docencia Donde nij es la frecuencia absoluta para los individuos que presentan la modalidad conjunta xi de X e yj de Y. ni. es la frecuencia absoluta marginal de la modalidad xi de X. n.j es la frecuencia absoluta marginal de la modalidad yj de Y. Así, ni. = n∑ = c j ijn 1 .j = n.. = ∑ = r i ijn 1 ∑∑ = = r i c j ijn 1 1 además las tablas: x1 x2 K xr ni. n1. n2. K nr. Y y1 y2 K yc n.j n.1 n.2 K n.c Se conocen con el nombre de frecuencia absoluta marginal de las variables X e Y respectivamente. Todo lo anterior puede también ser expresado como frecuencias relativas: Y X \ y1 y2 ... yj ... yc Total fila x1 f11 f12 f1j f1c f1. x2 f21 f22 f2j f2c f2. M xi fi1 fi2 fij fic fi. M xr fr1 fr2 frj frc fr. Total columna f.1 f.2 f.j f.c 1 Donde fij es la frecuencia relativa para los individuos que presentan la modalidad conjunta xi de X e yj de Y. fi. es la frecuencia relativa marginal de la modalidad xi de X. f.j es la frecuencia relativa marginal de la modalidad yj de Y. Así, fi. = f∑ = c j ijf 1 .j = =1 ∑ = r i ijf 1 ∑∑ = = r i c j ijf 1 1 además las tablas X x1 x2 K xr fi. f1. f2. K fr. Y y1 y2 K yc f.j f.1 f2 K f.c 25 Apuntes preparados por el profesor Sr. Rosamel Sáez Estadística con fines de docencia Se conocen con el nombre de frecuencia relativas marginal de las variables X e Y. Asociados a las distribuciones marginales podemos definir algunos estadísticos de tendencia central o dispersión. Las medias marginales de la variable X e Y se definen del siguiente modo: ∑∑ == == r i ii r i ii xfxnn X 11 1 .. .. ∑∑ == == c j jj c j jj yfynn Y 11 1 .. .. Las varianzas marginales respectivas son: ∑ = −= r i iix Xxnn S 1 22 1 )(. .. ∑= −= c j jjy Yynn S 1 22 1 )(. .. Una medida del grado de relación lineal entre las variables X e Y es la covarianza dada por Sxy, donde ∑∑ = = −−= r i jii c j xy YyXxnn S 1 1 1 ))((. .. Una formula alternativa de cálculo para la covarianza es ∑∑∑∑ = == = −=−= r i c j jiij r i c j jiijxy YXyxfYXyxnn S 1 11 1 1 .. Un problema de la covarianza es que depende de las unidades de medida por lo que no logramos cuantificarel grado de relación lineal entre dos variables. Una medida adimensional del grado de relación lineal entre las variables X e Y lo da el coeficiente de correlación de Pearson dado por: yx xy SS S r = Observe que 11 ≤≤− r Empíricamente, Si 750.≥r decimos que la relación lineal entre X e Y es adecuada, en cambio si r 0 decimos que no existe relación lineal entre X e Y. ≈ Mientras más cercano a 1 o a –1 es el coeficiente de correlación lineal mejor es la dependencia lineal entre ambas variables. 26 Apuntes preparados por el profesor Sr. Rosamel Sáez Estadística con fines de docencia De todos los elementos de la población, podemos estar interesados en un conjunto más pequeño y que está formado por aquellos elementos que han presentado la modalidad yj para algún j=1,2,...,c. El número de elementos de este conjunto sabemos que es n.j La variable X definida sobre este conjunto se denomina variable condicionada y se suele denotar mediante X/Y=yj. La distribución de frecuencias absolutas de esta nueva variable n.j. Por tanto sus frecuencias relativas, que denominaremos frecuencias relativas condicionadas son: j ij ji n n f ./ = Análogamente podemos definir la frecuencia relativa condicionada para la variable condicionada Y/X=xj . Las frecuencias relativas condicionadas son: ./ i ij ij n n f = Probabilidades El concepto de probabilidad ocupa un lugar importante en el proceso de toma de decisión bajo incertidumbre, no importa el campo de la ciencia en que el problema es enfrentado. En muy pocas situaciones de toma de decisión la información perfecta está disponible, es decir, todos los factores u hechos necesarios. La probabilidad entra en el proceso desempeñando el papel de substituto para la certeza, substituto para el completo conocimiento. La probabilidad es especialmente significativa en el área de la inferencia estadística. Aquí la preocupación principal es obtener conclusiones o hacer inferencias provenientes de experimentos que implican incertidumbre. El concepto de la probabilidad permite generalizar de la información obtenida de lo sabido (muestra) a lo desconocido (población), y agregar un alto grado de confianza en estas generalizaciones. Por lo tanto, la probabilidad es una de las herramientas más importantes de la inferencia estadística. La probabilidad es un número entre 0 y 1 y corresponde a una especificación de que tan frecuente es probable que ocurra un evento de interés particular entre un gran número de ensayos (situaciones en las que el evento puede suceder). Antes de dar una definición más formal de probabilidad definiremos algunos términos de interés: 27 http://www.mirrorservice.org/sites/home.ubalt.edu/ntsbarsh/Business-stat/opre504S.htm#rstatInferentia http://www.mirrorservice.org/sites/home.ubalt.edu/ntsbarsh/Business-stat/opre504S.htm#rstatInferentia http://www.mirrorservice.org/sites/home.ubalt.edu/ntsbarsh/Business-stat/opre504S.htm#rInferentiaStatist Apuntes preparados por el profesor Sr. Rosamel Sáez Estadística con fines de docencia Experimento: es cualquier proceso o actividad que genera observaciones. Según la naturaleza del experimento estos se clasifican en determinísticos y no determinísticos o aleatorios. Estos últimos serán la naturaleza de nuestro estudio. Ejemplo: Suponga un experimento sencillo que consiste en soltar un plumón usado para escribir en el pizarrón. Si el interés es observar si este cae o no, cada uno de nosotros, incluso sin necesidad de realizar el experimento, sabemos que va a caer. Hay un resultado totalmente determinístico. Sin embargo si nuestra observación se centra en ver hacia que parte va a quedar apuntando la tapa, tenemos muchos resultados posibles y obviamente uno y sólo uno va a ocurrir. Su resultado es no determinístico. Espacio muestral: Sea E un experimento aleatorio, al conjunto de todos los resultados posibles de E le llamamos espacio muestral y le denotaremos por Ω . Ejemplo 1: Suponga el experimento que consiste en observar a las 9:30 hrs., el número de bombas en servicio en una gasolinera con seis bombas. Solución: { }6543210 ,,,,,,=Ω Ejemplo 2: Suponga que en una fábrica que produce máquinas para sellar al vacío, en un momento dado, seleccionan tres de manera aleatoria para hacer secuencialmente, pruebas de calidad. Si denotamos por C si cumple y por N si no cumple, escriba el espacio muestral. Observación: Como Ud. se habrá dado cuenta el espacio muestral hace el papel de conjunto universo, de aquí que las siguientes definiciones estén relacionadas con teoría de conjuntos. Evento o suceso: Es cualquier subconjunto del espacio muestral. Estos son denotados por letras mayúsculas tales como A, B, C, A1, A2, ... Ejemplo 3: Del ejemplo 1, escriba los siguientes eventos: i) El número de bombas en servicio es a lo menos 2. ii) El número de bombas en servicio es a lo sumo 3. iii) Hay un número par de bombas en servicio. iv) Hay más de cuatro bombas en servicio. Solución i) { }654321 ,,,,=A ii) { }32102 ,,,=A iii) { }6423 ,,=A iv) { }654 ,=A 28 Apuntes preparados por el profesor Sr. Rosamel Sáez Estadística con fines de docencia Observación: De acuerdo a la definición de evento y de acuerdo a la teoría de conjuntos, y son eventos, llamados evento seguro y evento imposible respectivamente. Ω Φ Definición: Dos eventos A y B, cualesquiera de Ω son disjuntos si y sólo si no tienen elementos comunes, es decir su intersección es vacía. φ=∩⇔ BAdisjuntosByA Definición: Diremos que un evento ocurre si uno cualesquiera de sus elementos es el resultado del experimento. De acuerdo a esta definición basta con conocer la cardinalidad de un evento para saber de cuantas maneras puede ocurrir un evento. Así del ejemplo 3, el evento A1 ocurre de 5 formas en cambio el evento A3 puede ocurrir de 3 formas. Un problema interesante que se presenta ahora es poder contar el número de elementos que tiene un conjunto. Este problema es totalmente resuelto cuando tenemos los elementos a la vista. Sin embargo esto no siempre es así, por ejemplo, suponga que un cliente va a comprar una caja de ampolletas, pero el quiere asegurarse que están estén todas buenas. Suponga además, que por alguna razón no podemos probar todas las ampolletas entonces se decide un plan de muestreo y una regla de decisión. Se va a revisar sólo 5 ampolletas seleccionadas al azar y si se encuentra 2 o más que no funcionen, no se hace la compra. Agreguemos a esto, que se sabe que en la caja que tiene 48 ampolletas vienen 3 falladas ¿Cuántos grupos de cinco ampolletas son posibles formar? ¿Cuántos de estos tendrán a lo más 1 ampolleta fallada? Técnicas de conteo: Definición: (Principio de suma) Suponga que una operación O1 puede realizarse de n formas y otra operación O2 puede realizarse de m formas, entonces, la operación “O1 o O2” puede efectuarse de n+m formas. En la aplicación del principio de suma hay que cuidar que ninguna forma en O1 se repita en O2. De ocurrir esto la operación “O1 o O2” puede efectuarse de n+m-k formas, siendo k el número de coincidencias. Definición : (Principio de multiplicación o regla del producto) Suponga que una operación O1 se puede realizar de n formas y una segunda operación O2 (O2 siguiendo inmediatamente a O1) puede realizarse de m formas, entonces, ambas operaciones “O1 y O2” pueden efectuarse de nm formas. En la aplicación del diagrama del producto es posible aplicar una representación conocida como diagrama del árbol, que consiste en representar todas las posibilidades mediante ramas que nacen desde un vértice. 29 Apuntes preparados por el profesor Sr. Rosamel Sáez Estadística con fines de docencia Por ejemplo si una operación O1 se puede realizar de 4 formas y una operación O2 se puede realizar de 3 formas entonces la operación “O1 y O2” se puede realizar de 12 formas,gráficamente: Observación: Una extensión de estos principios a más operaciones se hace de manera natural. Análisis combinatorio. Definición: Cada una de las ordenaciones que pueden formarse tomando algunos o todos los elementos de un número de objetos se llama arreglo o variación. Definición: Las variaciones en las que entran todos los objetos, es decir, las diversas ordenaciones de todos los elementos, se llaman permutaciones. Definición: Dos permutaciones cualesquiera contienen los mismos elementos, sólo difieren en el orden en que los elementos están colocados. Definición : Cada uno de los grupos que pueden formarse tomando algunos o todos los elementos de un número de objetos de modo que dos cualquiera de ellos difieran en algún objeto se llama combinación. Para entender la diferencia entre permutación y combinación, consideremos el siguiente ejercicio. Escribir todas las permutaciones y combinaciones que podemos obtener con tres objetos seleccionado de un conjunto de cuatro. Si denotamos por a, b, c y d los cuatro objetos se tiene: Combinaciones Permutaciones abc abd acd bcd abc acb cab cba bca bac abd adb dab dba bda bad acd adc dac dca cda cad bcd bdc dbc dcb cdb cbd 30 Apuntes preparados por el profesor Sr. Rosamel Sáez Estadística con fines de docencia Observe que sólo tenemos cuatro combinaciones de tres objetos seleccionado de un conjunto de cuatro, en cambio, hay 24 permutaciones. Observe además que cada combinación da origen a 6 permutaciones. Definición: El número de permutaciones de n objetos distintos es n!. n! = n(n-1)(n-2) ... 2*1 (producto de los n primeros número naturales). 0! =1 Definición: El número de permutaciones de n objetos distintos, tomados de r a la vez, nPr, es: )!( !Pr rn nn − = Definición: El número de permutaciones de n objetos de los cuales n1 son de una clase 1, n2 son de una clase 2, ..., nk son de una clase k, con n1+n2+...+nk = n, denotado por nPn1,n2,...,nk, es !!...! !,...,, k k nnn nnnnPn 21 21 = Definición: El número de combinaciones diferentes de n objetos tomados de r a la vez, nCr, es !)!( ! rrn nnCr − = Ahora que sabemos contar, volvamos al ejemplo de la caja de ampolletas. Una primera pregunta que debemos hacernos es, ¿interesa el orden en que las 5 ampolletas van a ser seleccionadas?. Como el orden no es relevante para lo que deseamos observar, la respuesta es no. Luego el número de quíntuplas posibles que pueden ser formadas es 48C5 = 1.712.304, y de estas, el número de quíntuplas que contienen a lo más una con falla es: 3C0 x 45C5 + 3C1 x 45C4 es decir 1.668.744. Ejemplo: ¿Cuántos números diferentes de seis cifras pueden formarse con los nueve dígitos 1, 2, 3, …,9? Antes de responder observemos que ahora interesa el orden en que aparecen las cifras, luego la respuesta es 9P6 = 60.480 números ¿Cuántos comienzan con un número impar?. Un ejercicio para razonar: Con 7 consonantes y 4 vocales ¿cuántas palabras (con o sin sentido) pueden formarse, conteniendo cada una 3 consonantes y 2 vocales?. 31 Apuntes preparados por el profesor Sr. Rosamel Sáez Estadística con fines de docencia Habiendo definido algunos elementos importantes daremos una definición formal de probabilidad. Como dijimos anteriormente, la probabilidad es un número entre 0 y 1, que se asigna a un fenómeno como su posibilidad de ocurrir. Casi todos conocemos las leyes del azar relacionados con el lanzamiento de una moneda. Si alguien nos pregunta cuál es la probabilidad que una moneda muestre cara cuando esta es lanzada, la respuesta será 2 1 . Esta respuesta se basa en la experiencia común que se tiene con las monedas, en que se supone que la moneda es legítima y que se lanza de manera legítima. Este es un ejemplo de probabilidad objetiva la cual tiene dos interpretaciones. La primera se basa en la simetría de los resultados que implica que resultados idénticos en los aspectos esenciales deben tener la misma probabilidad, por ejemplo en el lanzamiento de un dado, la probabilidad que caiga cualquiera de los números es 6 1 . La segunda interpretación es la probabilidad como frecuencia relativa la que se basa en la experiencia histórica en situaciones idénticas. Cuando la probabilidad se basa en la experiencia personal o en el grado de creencia que se tenga respecto de la ocurrencia de un evento, esta se denomina probabilidad subjetiva. Probabilidad como frecuencia relativa. Suponga que un experimento es repetido N veces bajo las mismas condiciones. Si A es un evento de este experimento, el que ocurre n(A) veces en estas N repeticiones del experimento, se define la probabilidad del evento A, P(A), mediante N AnAP )()( = Del ejemplo de las ampolletas, ¿cuál es la probabilidad que la caja sea comprada?. De acuerdo al criterio de decisión, compraremos la caja sólo, si a lo más hay una con falla entre las cinco que son revisadas. Ω en este caso está compuesto por todas las quíntuplas que son posibles de seleccionar desde las 48 unidades que tiene la caja y el número de elementos que tiene , n( ) es 1.712.304 Ω Ω Sea A el evento que contiene todas las quíntuplas que tienen 0 o 1 ampolleta con falla, así n(A)= 1.668.744 y luego P(A) = 0,97 Un concepto más formal de probabilidad es a través de un desarrollo más axiomático. 32 Apuntes preparados por el profesor Sr. Rosamel Sáez Estadística con fines de docencia Definición: Se llama probabilidad a una función de conjunto, real valuada, definida sobre la clase de todos los subconjuntos del espacio muestral , tal que, a un subconjunto cualquiera A de Ω Ω asocia un número, denotado por P(A), llamado probabilidad de A y que debe satisfacer los siguientes axiomas: Ax1.- P( ) = 1 Ω Ax2.- P(A) ≥ 0 Ax3.- P(UAi ) = ∑ P(A =1i i) para toda sucesión disjunta de eventos A1, A2, ….. Dado los tres axiomas podemos dar las siguientes propiedades: Sean A y B dos eventos cualesquiera de Ω a) P(Φ ) =0 b) P(Ac)= 1 – P(A) donde Ac es el complemento del evento A bajo Ω . c) P(Ac B) = P(B) – P(A ∩ ∩B) d) P(A U B)= P(A) + P(B) – P(A ∩B) e) Si A ⊆ B entonces P(A) ≤ P(B) f) P(A) = P(A1) + P(A2) +…+ P(Ak) donde A1, A2,…, Ak forman una partición del conjunto A, es decir: - A= i k i AU 1= - Ai ∩ Aj = Φ ji ≠∀ Ejercicios: Problema 1: Tres caballos A, B, y C intervienen en una carrera; A tiene el doble de posibilidad de ganar que B, y B, el doble de ganar que C. ¿Cuáles son las respectivas probabilidades de ganar? ¿Cuál es la probabilidad que el caballo B o C ganen? Problema 2: Sean dos artículos escogidos al azar de un grupo de 12 de los cuales 4 son defectuosos. Sea A evento, dos artículos son defectuosos y sea B evento, dos artículos no defectuosos. Obtener P(A) y P(B). Problema 3: Se escogen tres lámparas entre 15 de las cuales 5 son defectuosas. Halle la probabilidad que: i) ninguna sea defectuosa. ii) Exactamente una sea defectuosa. iii) Una por lo menos sea defectuosa. Problema 4: Una clase consta de 10 hombres y 20 mujeres de los cuales la mitad de los hombres y la mitad de las mujeres tienen los ojos claros. Hallar la probabilidad que una persona escogida al azar sea un hombre o tenga los ojos claros. 33 Apuntes preparados por el profesor Sr. Rosamel Sáez Estadística con fines de docencia Problema 5: Sean A y B eventos con P(A) = 8 3 , P(B)= 2 1 Y P(A∩B)= 4 1 . Hallar P(AUB), P(AC), P(BC), P(AC∩ BC), P(ACU BC), P(A∩ BC) y P(B∩AC). Nota: (AUB)C = AC∩ BC y (A∩ B)C = ACUBc (leyes de De Morgan) Problema 6: Tomemos tres cajas según se indica: Caja 1: Contiene 10 lámparas de las cuales cuatro son defectuosas. Caja 2: Contiene 6 lámparas con una defectuosa. Caja 3: Contiene 8 lámparas con 3 defectuosas. Escogemos al azaruna caja y luego sacamos al azar una lámpara ¿Cuál es la probabilidad que la lámpara sea defectuosa? Problema 7: En cierta facultad, 25% de los estudiantes perdieron matemáticas, 15% perdieron química y 10% perdieron las dos. Se selecciona un estudiante al azar: i) Si perdió química ¿cuál es la probabilidad que perdió matemática?. ii) Si perdió matemáticas ¿cuál es la probabilidad que perdió química? iii) ¿Cuál es la probabilidad que perdió matemática o química? Problema 8: Suponga dos cajas A y B, en que la caja A contiene 8 artículos de los cuales 3 son defectuosos, y la caja B contiene 5 artículos de los cuales 2 son defectuosos. Si se escoge al azar un artículo de cada caja. i) ¿Cuál es la probabilidad que ambos artículos sean defectuosos? ii) ¿Cuál es la probabilidad que un artículo sea defectuosos y el otro no? iii) Si un artículo es defectuoso y otro no ¿cuál es la probabilidad que el articulo defectuoso proceda de la caja A? Problema 9: Suponga que tenemos dos urnas como sigue: La urna A contiene 5 fichas rojas y tres blancas. La urna B contiene una ficha roja y dos blancas. Se lanza un dado balanceado. Si aparece un 3 o un 6 se saca una ficha B y se pone en la urna A y luego se saca una ficha de la urna A, de lo contrario se saca una ficha de la urna A y se coloca en B para luego sacar una ficha de B. i) ¿Cuál es la probabilidad que ambas fichas sean rojas? ii) ¿Cuál es la probabilidad que las dos fichas sean blancas? iii)¿Cuál es la probabilidad que ambas fichas sean de distinto color? Problema 10: Suponga que observamos un conjunto de 1100 individuos los que pueden ser clasificados de acuerdo a dos proveedores y a tres características; c1, c2 y c3. Suponga además que estos pueden ser ordenados en la siguiente tabla de doble entrada: 34 Apuntes preparados por el profesor Sr. Rosamel Sáez Estadística con fines de docencia Característica Proveedor c1 c2 c3 P1 132 85 300 P2 220 198 165 a) Si seleccionamos un individuo al azar de esta población ¿cuál es la probabilidad: i) qué tenga la característica c3? ii) qué provenga del proveedor 1? iii) qué provenga del proveedor 2 o tenga la característica c2? iv) qué provenga del proveedor 2 y tenga la característica c1? b) Si seleccionamos un individuo al azar y proviene del proveedor 2 ¿Cuál es la probabilidad que tenga la característica c1? c) Si seleccionamos un individuo al azar y tiene la característica c2 ¿Cuál es la probabilidad que provenga del proveedor 2? Observemos que en la letra (b) y (c) el espacio muestral ha sido reducido a un conjunto más pequeño de interés como es en el primer caso, que el articulo seleccionado proviene del proveedor 2, o en el segundo caso que se sabe que el articulo seleccionado tiene la característica c2, es decir, en ambos casos la probabilidad pedida está condicionada a la ocurrencia ya de un evento. Definición: Sean A y B dos eventos cualesquiera de Ω , se define la probabilidad condicional del evento A dado que el evento B ha ocurrido, P(A/B) mediante la expresión: (c.1) )( )()/( BP BAPBAP ∩= si P(B) ≠ 0 Observe que en la expresión (c.1) participan tres términos, la probabilidad condicional P(A/B), la probabilidad conjunta de dos eventos y la probabilidad marginal P(B). )( BAP ∩ De (c.1) = P(A/B)P(B) (c.2) )( BAP ∩ Así, es decir, la probabilidad conjunta de dos eventos es el producto de una 35 Apuntes preparados por el profesor Sr. Rosamel Sáez Estadística con fines de docencia probabilidad condicional y una probabilidad marginal. Análogamente se tiene que )( BAP ∩ = P(B/A)P(A) (c.3). Las expresiones (c.2) y (c.3) se conocen como regla del producto para )( BAP ∩ Del ejemplo anterior (pag 43): Letra b: Sea A: evento que el artículo seleccionado al azar tiene la característica c1 Sea B: evento que el artículo seleccionado al azar proviene del proveedor 2 Entonces de (c.1), P(A/B) = 583 220 = 0.38 Respuesta: Hay un 38% de probabilidad que un artículo que proviene del proveedor 2 posea la característica c1. Letra c: Sea C: evento que el artículo seleccionado al azar proviene del proveedor 2. Sea D: evento que el artículo seleccionado al azar tiene la característica 2. Entonces de (c.1), P(C/D) = 283 198 = 0.70 Respuesta: Hay un 70% de probabilidad que un artículo que tiene la característica c2 provenga del operador 2. Ahora bien, si en la expresión (c.2), P(A/B) = P(A), entonces podemos ver que el evento B no influye en la ocurrencia del evento A, es decir, los eventos A y B son independientes. Definición: Sean A y B dos eventos cualesquiera de Ω . Se dice que los eventos A y B son independientes si y sólo si = P(A) P(B) )( BAP ∩ Observación: Si A y B son eventos independientes entonces: i) A y Bc son eventos independientes ii) Ac y B son eventos independientes iii) Ac y Bc son eventos independientes En resumen, para calcular la probabilidad conjunta entre los eventos A y B, existen tres formas: 36 Apuntes preparados por el profesor Sr. Rosamel Sáez Estadística con fines de docencia )( BAP ∩ = ⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ ⎭ ⎬ ⎫ ∩ ciaindependendecondiciónbajoBPAP adependencidecondiciónbajo APABP BPBAP relativafrecuenciaComoN BAn )()( )()/( )()/( )( (c.4) Ejemplo: Suponga que dos estudiantes, Juan y José, del curso de inferencia van a estudiar a la biblioteca, llegan a distintas horas pero ambos solicitan el mismo libro de entre los disponibles para estudiar probabilidades, ninguno sabe que el otro se encuentra ahí. Más aún, a ambos le llama la atención un ejercicio que creen que puede aparecer en un certamen. Juan de acuerdo a lo aprendido en clases tiene un 35% de probabilidad de resolver el ejercicio y José un 45%. ¿Cuál es la probabilidad qué el ejercicio sea resuelto?. Solución 1: El ejercicio será resuelto si lo resuelve sólo Juan, sólo José o es resuelto por ambos. Sea A evento el problema es resuelto por Juan Sea B evento el problema es resuelto por José Sea S evento el problema es resuelto. P(S) = P(A B∩ c) + P(Ac∩B) + P(A∩B) De acuerdo al enunciado los eventos A y B son independientes, luego: P(S) = P(A)P(Bc) + P(Ac)P(B) + P(A)P(B) = 0.35(1-0.45)+(1-0.35)0.45 + 0.35*0.45 = 0.643 Respuesta: Hay una probabilidad de un 64.3% que el problema sea resuelto. Solución 2: Busque una segunda forma de resolver el ejercicio. Suponga ahora que el espacio muestral puede ser particionado por un conjunto de k eventos disjuntos A1, A2, …, Ak es decir: Ω = A1U A2U …U Ak Φ=∩ ji AA ji ≠∀ Suponga además que estamos interesado en determinar la probabilidad de ocurrencia de un evento B cualquiera de Ω . 37 Apuntes preparados por el profesor Sr. Rosamel Sáez Estadística con fines de docencia Esquemáticamente: B A1 A2 A3 A5 A4 A6 Ak B A1 A2 A3 A5 A4 A6 Ak De la figura observemos que el conjunto B puede ser reescrito como unión de los trocitos en que B se interfecta con algún Aj, así B= (B∩A1)U(B∩A2)U…U(B∩Ak) Obviamente algunas intersecciones son vacías, luego P(B)= P((B A∩ 1)U(B A∩ 2)U…U(B∩Ak)) = P((B A∩ 1))+P((B∩A2))+…+P((B∩Ak)) = P(B/A1)P(A1) + P(B/A2)P(A2) + …+ P(B/Ak)P(Ak) por (c.4) Expresión conocida como teorema de la probabilidad total para el evento B. Una pregunta interesante que surge aquí es, si sabemos que el evento B ha ocurrido ¿cuál es la probabilidad que el responsable de esta ocurrencia sea el evento Aj ? Esto es P(Aj / B) = )( )( BP BAP j ∩ = ∑ = k i ii jj APABP APABP 1 )()/( )()/( Expresión conocida como regla de Bayes. Ejercicios: 1.- Una planta de ensamblado recibe sus reguladores de voltaje de tres proveedores diferentes; el 60% lo recibe del proveedor 1,30% del proveedor 2 y 10% del proveedor 3. Se sabe además que el 95% de los regulares de voltaje del proveedor 1, 80% de los del proveedor 2 y 65% de los del proveedor 3 se desempeñan de acuerdo con las especificaciones. a) Si revisamos al azar un regulador de voltaje de esta planta ¿cuál es la probabilidad que se desempeñe de acuerdo con las especificaciones? b) Si seleccionamos al azar un regulador de voltaje y no se desempeña de 38 Apuntes preparados por el profesor Sr. Rosamel Sáez Estadística con fines de docencia acuerdo con las especificaciones ¿cuál es la probabilidad que haya sido suministrado por el proveedor 1?. c) Si seleccionamos al azar un regulador de voltaje y se desempeña de acuerdo con las especificaciones ¿cuál es la probabilidad que haya sido suministrado por el proveedor 3?. d) Si seleccionamos al azar un regulador de voltaje ¿cuál es la probabilidad que no se desempeñe de acuerdo con las especificaciones y haya sido suministrado por el proveedor 2? 2.- Suponga que una máquina usada en la fabricación de piezas puede estar ajustada o desajustada. Cuando está ajustada produce un 1% de piezas defectuosas y cuando está desajustada un 10%. Se sabe que la probabilidad de desajuste de la máquina es de un 30%. a) Si se selecciona al azar una pieza producida por esta máquina y es buena ¿cuál es la probabilidad que la máquina haya estado desajustada?. b) Supongamos ahora que se eligen al azar 10 piezas independientes y todas son buenas ¿calcular la probabilidad que la máquina haya estado desajustada? 39 Comente Una formula alternativa de cálculo para la covarianza es Probabilidades Permutaciones
Compartir