Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
www.editorialpatria.com.mx El aprendizaje despliega las alas de la libertad Probabilidad y Estadística II proporciona al estudiante los co- nocimientos necesarios para el cálculo de probabilidades y el análisis descriptivo de datos de dos variables, como un funda- mento para comprender diversos fenómenos que se presen- tan en la economía, administración, en las ciencias sociales, experimentales y en general en cualquier actividad humana. Está totalmente apegado tanto en forma como en conte- nido, al programa actualizado mediante la reforma curricular del Bachillerato General. Este libro se desarrolla con un enfoque constructivista y un atractivo diseño enriquecido con las siguientes secciones: • En contacto con tus conocimientos: establece un puen- te entre los conocimientos que posee el alumno y los que va a adquirir. • Una ventana al conocimiento: novedosas lecturas o blo- ques informativos relacionados con el contenido desa- rrollado en cada unidad. • Evaluación formativa: aparece estratégicamente a lo largo del texto para confirmar que el alumno vaya asimi- lando los nuevos conocimientos. • Evaluación sumativa: contiene diversos reactivos ca- paces de demostrar si el estudiante logró aprender el tema. • Ampliando el conocimiento: incluye un glosario y biblio- grafía sugerida. Esperamos que este libro sea una herramienta nove- dosa, interactiva y útil para desarrollar en los estudiantes la capacidad de análisis al interpretar datos de diversos fenó- menos y situaciones que se presentan en la vida cotidiana y profesional. S ánchez • Inzunsa • R am írez P a t r ia P R O B A B IL ID A D Y E S T A D ÍS T IC A II PROBABILIDAD Y ESTADÍSTICA B A c h I l l E R Ato G E n E R A l Ernesto Sánchez • Santiago Inzunsa • Greivin Ramírez II ISBN 978-607-438-029-3 PROBABILIDAD Y ESTADÍSTICA PRIMERA EDICIÓN EBOOK MÉXICO, 2014 Ernesto Alonso Sánchez Sánchez Santiago Inzunsa Cazares Greivin Ramírez Arce GRUPO EDITORIAL PATRIA Dirección editorial: Javier Enrique Callejas Coordinación editorial: Alma Sámano Castillo Diseño de interiores: Juan Castro (Trocas) Diseño de portada: Juan Bernardo Rosado Solís Imágenes: Jupiter Images Unlimited Revisión Técnica: M.F. Ricardo Robles Reyes Probabilidad y Estadística II para DGB Derechos reservados: ©2014, Ernesto Alonso Sánchez Sánchez, Santiago Inzunsa Cazares, Greivin Ramírez Arce ©2014, GRUPO EDITORIAL PATRIA, S.A. de C.V. Renacimiento 180, Col. San Juan Tlihuaca, Delegación Azcapotzalco, Código Postal. 02400, México, D.F. Miembro de la Cámara Nacional de la Industria Editorial Mexicana Registro núm. 43 ISBN ebook: 978-607-744-034-5 Queda prohibida la reproducción o transmisión total o parcial del contenido de la presente obra en cualesquiera formas, sean electrónicas o mecánicas, sin el consentimiento previo y por escrito del editor. Impreso en México Printed in Mexico Primera edición ebook: 2014 info editorialpatria.com.mx www.editorialpatria.com.mx www.editorialpatria.com.mx mailto:info@editorialpatria.com.mx DEDICATORIA Dedico esta obra a mi querida esposa Verónica y a mis hijas Luciana y Paulina, por su apoyo y comprensión. iii v PRESENTACIÓN Estimados profesores y estudiantes: El propósito de esta obra es apoyar al docente en la tarea de proporcionar a sus estudiantes las herramientas iniciales, teóricas y prácticas, de la probabilidad y la estadística, así como mostrar la forma de aplicarlas en el conocimiento del mundo en que vivimos. El alumno encontrará aquí los conceptos básicos que prescribe el programa y que se presentan en contextos signi- fi cativos. El estudio de la estadística es fundamental para ser un ciudadano consciente y crítico, y un profesional informado y responsable. La sociedad actual se caracteriza por generar grandes cantidades de información cuantitativa y la estadística se presenta como la responsable de pro- cesarla, darle credibilidad y comunicarla. Los profesionales y los ciudadanos en general deben ser capaces de entender algunos de los procesos del manejo de la información y evaluar, con base en la evidencia (datos), la fuerza de las afi rmaciones que de ella se desprenden. No obs- tante, aún falta mucho para que la mayoría de los ciudadanos, incluyendo los profesionales, actúen de manera inteligente frente a la información estadística, ya sea porque no la entienden o porque la aceptan acríticamente. En el presente libro, se pretende atacar esta defi ciencia. Su enfoque didáctico ofrece una oportunidad para que los estudiantes desarrollen un pen- samiento estadístico y obtengan los conocimientos necesarios para usar las técnicas propias de la materia. Entre sus características principales es la de formular problemas de interés para el alumno y sugerir soluciones obtenidas a partir de la recolección y el análisis de datos reales. Este segundo volumen se encuentra dividido en cuatro unidades que son: 1. Probabilidad conjunta 2. Distribución de probabilidad de variables aleatorias discretas 3. Distribución de probabilidad de variables aleatorias continuas 4. Análisis de datos de dos variables En ellas se incluyen problemas estadísticos y de probabilidad en diversos escenarios. La expo- sición se complementa con tres secciones que enriquecen el contenido básico, a saber: • En contacto con tus conocimientos, • Una ventana al conocimiento y • La estadística y tu comunidad. Se proponen también diferentes tipos de ejercicios, problemas y pequeñas investigaciones para que el estudiante los realice y consolide así sus conocimientos. Esperamos que la presente obra sea útil para los alumnos y estaremos atentos a cualquier crítica y sugerencia para mejorarla. Los autores CONTENIDO UNIDAD 1 PROBABILIDAD CONJUNTA ................................................................ 2 1.1 Defi nición de probabilidad conjunta .............................................................6 1.2 Eventos mutuamente excluyentes .................................................................8 1.2.1 Regla de la adición ................................................................................8 1.3 Eventos independientes ...............................................................................11 1.4 Probabilidad condicional .............................................................................13 1.4.1 Fórmula de la probabilidad condicional .............................................14 1.4.2 Regla del producto ..............................................................................18 1.4.3 Probabilidad total................................................................................21 1.4.4 Teorema de Bayes (versión simple).....................................................25 UNIDAD 2 DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES ALEATORIAS DISCRETAS .........................................................32 2.1 Distribución de probabilidad de una variable aleatoria discreta ..................34 2.1.1 Variable aleatoria discreta ...................................................................35 2.1.2 Representación de una distribución de probabilidad .........................36 2.2 Distribución de probabilidad binominal .....................................................50 2.2.1 Experimento de probabilidad binomial ...............................................50 2.2.2 Función de probabilidad binominal ....................................................52 2.2.3 Media y desviación estándar de la distribución de probabilidad binomial .....................................................................65 UNIDAD 3 DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES ALEATORIAS CONTINUAS .......................................................76 3.1 Distribución de probabilidad de una variable aleatoria continua ................78 3.1.1. Distribución de probabilidad normal ................................................82 3.2 Distribución de probabilidadnormal estandarizada ....................................87 UNIDAD 4 ANÁLISIS DE DATOS DE DOS VARIABLES ............................106 4.1 Representación de datos de dos variables ..................................................108 4.2 Correlación lineal ......................................................................................129 4.3 Regresión lineal .........................................................................................133 ANEXO ...................................................................................................145 Tabla 1 Valores de la distribución de probabilidad binomial P(X 5 x) .........145 Tabla 2 Para un valor dado de Z, la probabilidad tabulada corresponde a P(Z # z). ....................................................................151 Tabla 3 Para un valor dado de z, la probabilidad tabulada corresponde a P(Z # z). ....................................................................152 1 Tema 1 1.1 DEFINICIÓN DE PROBABILIDAD CONJUNTA Tema 2 1.2 EVENTOS MUTUAMENTE EXCLUYENTES Tema 3 1.3 EVENTOS INDEPENDIENTES Tema 4 1.4 PROBABILIDAD CONDICIONAL Objetivo El estudiante resolverá proble- mas de probabilidad condicional en diversas situaciones entre las que se distinguirán aquellas que sean signifi cativas en el ámbito escolar y personal. Para ello, aprenderá a identifi car y aplicar las operaciones de eventos (complementación, unión y con- junción) y a calcular sus proba- bilidades utilizando la regla de la probabilidad del complemento, regla de la adición (o suma) y la regla de la multiplicación para eventos dependientes e inde- pendientes; además, entenderá y aplicará el teorema de Bayes. Se fomentará el trabajo colaborativo y una actitud positiva hacia la materia y sus compañeros. Probabilidad conjunta Contenido Unidad 1 tus conocimientos En contacto con • Imagina una situación en la que esperas que ocurran dos eventos simultáneamente. Por ejemplo, considera los dos eventos siguientes: “tener dinero para invitar a alguien al cine” y “que ese alguien acepte ir al cine con uno”. ¿Qué es más fácil: que ocurra uno de los eventos o que ocurran ambos? • Sean A y B dos eventos de una experiencia aleatoria. ¿En cuál de los siguientes incisos hay una afi rmación cierta? a ) P (A y B ) < P (A ) b ) P (A y B ) > P (A ) c ) No se puede decir la relación de orden entre P (A y B ) y P (A ), ya que depende de la identidad de A y B. • ¿Qué es más probable? a ) “Que una madre con ojos azules tenga una hija con ojos azules”. b ) “Que una hija con ojos azules tenga una madre con ojos azules”. c ) “Ambos eventos son igualmente probables”. Después de responder intuitivamente, elabora un modelo de población con madres e hijas (por ejemplo, utiliza tarjetas de una misma forma que repre- senten madres y otras que representen hijas) en el que algunas madres ten- gan ojos azules y otras ojos negros; lo mismo debe suceder con las hijas. Haz parejas de madres e hijas de diversas maneras y en cada caso responde las preguntas formuladas. ¿Te sorprende el resultado? Vuelve a responder las preguntas y argumenta tu respuesta. _______________________________________________________ _______________________________________________________ _______________________________________________________ _______________________________________________________ _______________________________________________________ PROBABILIDAD Y ESTADÍSTICA II 4 CASI 8 MILLONES DE PERSONAS MUEREN AL AÑO POR HIPERTENSIÓN El 80% de los casos ocurre en los países en vías de desarrollo según la investigación realizada por la Sociedad Internacional de Hipertensión LONDRES (Télam).2Cerca de ocho millones de personas en el mundo mueren cada año por hipertensión y 80% de estas muertes ocurre en los países en vías de desarrollo, informó la revista médica The Lancet. Una nueva investigación publicada por dicho medio señaló que 4 de cada 5 muertes por hipertensión ocurren en los países en desarrollo. El estudio realizado por la Sociedad Inter- nacional de Hipertensión, se llevó a cabo en la Universidad de Auckland, Nueva Zelanda. Se trata de uno de los primeros estudios que investigan a nivel mundial la extensión y distribución de la carga de esta enfermedad cardiovascular. La hipertensión es un trastorno caracterizado por presión sanguínea crónicamente alta y si no se lo controla puede conducir a derrames cerebrales, insufi ciencia cardiaca o infartos. Para la investigación, los científi cos compararon las tasas de la enfermedad según edades, sexo y regiones del mundo en el año 2001. Encontraron que la hipertensión había causado 7 600 000 muertes prematuras (13.5% del total glo- bal) y 92 millones de discapacidades. Según los autores del estudio, 54% de Una ventana al conocimiento INTRODUCCIÓN Una buena parte del cálculo de probabilidades consiste en encontrar la probabilidad de eventos combinados a partir de otros más simples cuyas probabilidades se conocen. Por ejemplo, se puede conocer la probabilidad de dos eventos y querer calcular la pro- babilidad de que ocurran ambos, es decir, de la probabilidad conjunta. En ocasiones se puede tener control sobre un evento pero no sobre otro y entonces cabe preguntarse por la probabilidad de que ocurra éste dado que ocurrirá aquél. Algunas relaciones en- tre eventos se defi nirán en este capítulo y se encontrarán maneras de calcular su proba- bilidad, estos procedimientos darán origen a los conceptos de probabilidad conjunta, eventos mutuamente excluyentes, eventos independientes, probabilidad condicional, regla del producto, probabilidad total y teorema de Bayes. Los conceptos anteriores, por un lado, son la base para el desarrollo de la teoría de probabilidades y, por otro, tienen diversas aplicaciones en situaciones de incerti- dumbre. En la sección de “Ventana al conocimiento” se han incluido dos ejemplos de contextos en los que se presentan los conceptos estudiados en esta Unidad, a saber, una relacionada con los datos sobre la mortalidad por hipertensión arterial y otra rela- cionada con las leyes de la herencia descubiertas por Mendel. Muchos ejemplos como los mencionados podrán ser investigados por los estudiantes si entienden las ideas aquí expuestas. PROBABILIDAD CONJUNTA 5 los accidentes cerebro-vasculares y 47% de las enfermedades cardiacas en el mundo se debieron a hipertensión. Más de la mitad de estas enfermedades ocurrieron en personas con una presión sistólica de 140 mmHg y de entre 45 y 69 años de edad. La investigación reveló que 80% de las muertes por hipertensión ocurrió en los países de bajos y medianos ingresos. Mientras que en los países ricos hubo 1 390 000 muertes, la cifra alcanzó 6 220 000 en los países en vías de desarrollo. Aunque la hipertensión pue- de causar dolores de cabeza, mareos y problemas de visión, la mayoría de la gente no presenta ningún síntoma en absoluto y por eso se la llama “el asesino invisible”. Según Stephen MacMahon, uno de los autores del estudio, la tasa de la enfermedad es cinco veces más grande en los países de bajos y medianos ingresos que en los países ricos. “Y sin embargo, en esas regiones sólo tienen acceso a menos de 10% de los recursos globales para tratamientos”, agregó. Según la Organización Mundial de la Salud, unos 17 millones de personas, 30% de la población mundial, mueren cada año por algún tipo de enferme- dad cardiovascular. Y la hipertensión 2junto con otros factores de riesgo como el sobrepeso, la obesidad, el tabaquismo y la inactividad física2 son responsables de hasta 90% de estas muertes. Presión sanguínea La presión sanguínea está determinada por la cantidad de sangre bombeada por el corazón y por el tamaño y condición de las arterias. Cuando se toma se presentan dos lecturas 2la presión sistólica y la diastólica2 que se miden en milí- metros de mercurio (mmHg). La primera se refi ere a la fuerza de la sangre expulsadadel corazón cuando éste late para bombear alrededor del cuerpo, y la diastólica es la presión cuando el corazón se está llenando de nuevo con sangre en preparación para el siguiente latido. Para la mayoría de la gente es deseable una presión sanguínea de menos de 130/85 mmHg. PROBABILIDAD Y ESTADÍSTICA II 6 1.1 DEFINICIÓN DE PROBABILIDAD CONJUNTA Dada una experiencia aleatoria con espacio muestral V y dos eventos A y B, se defi ne un nuevo evento llamado conjunción de A y B, que se denota con A > B, de la si- guiente manera: A > B ocurre siempre que ocurra A y ocurra B; es decir, que ocurran ambos simultáneamente. A la probabilidad de A > B, que se simboliza P(A > B), se le llama probabilidad conjunta de A y B. Si el espacio muestral es equiprobable, la probabilidad conjunta se calcula me- diante la ecuación: P(A > B) 5 (Cardinalidad de A y B) / Cardinalidad de V Ejemplos a) En el lanzamiento de un dado, sea A el evento “ocurre un número par” y B el evento “ocurre un número mayor que 3”. ¿Cuál es la probabilidad conjunta de A y B? Solución: El espacio muestral es V 5 {1, 2, 3, 4, 5, 6} Los eventos A y B son: A 5 {2, 4, 6} y B 5 {4, 5, 6}; de donde A > B 5 {4, 6}; entonces: P(A > B)52/6 2 4 6 5 3 1 Ω Gráfi ca 1.1 ¿Cuál es la probabilidad de muerte por hipertensión arterial? Entre los habitantes de países en desarrollo, ¿cuál es la probabilidad de muerte por hipertensión arterial? Fuente: http://www.lanueva.com/edicion_impresa/nota/5/05/2008/855123.html [Tomado de: http://www.taringa.net/posts/info/ 1206171/Estadisticas-sobre-Hipertension-Arterial.html] PROBABILIDAD CONJUNTA 7 b) En el título y subtítulo del artículo sobre la hipertensión se identifi can los even- tos: “muerte por hipertensión” y “pertenecer a un país en desarrollo”. Conviene representarlos así: H: muerte por hipertensión D: pertenecer a un país en desarrollo El evento conjunto de esos eventos es: H > D: “muerte por hipertensión de alguien que pertenece a un país en desarrollo”. La experiencia aleatoria que subyace en el artículo se puede pensar así: “tomar a un ciudadano del mundo y observarlo durante el año en estudio”. Uno de los eventos defi nidos se pregunta si muere o no de hipertensión; otro, si pertenece a un país en desarrollo. La probabilidad del evento H > D se calcula con el cociente de las muertes por hipertensión en los países en desarrollo (6 220 000) entre el número de perso- nas en el mundo durante el año del estudio. Aunque el artículo no informa cuál es la población mundial, ofrece datos para estimarla, cuando afi rma: Según la Organización Mundial de la Salud, unos 17 millones de personas, 30% de la población mundial, mueren cada año por algún tipo de enfermedad cardiovascular. Entonces la población mundial debe ser aproximadamente de 56.7 millones de personas. Sustituyendo tenemos: P H D( ) .> 5 6220000 56700000 0 11≅ Así, la probabilidad de que alguien de un país en desarrollo muera por hiper- tensión durante un año determinado sería aproximadamente de 11%; un porcentaje muy grande. Esta información debe llevar- nos a tener más cuidado con esta enfermedad. NOTA: Para el problema 3 que sigue, considera que una cade- na es una secuencia de águilas o soles; por ejemplo, la secuencia de cuatro volados representados por AASA está formada por tres cadenas, a saber: AA, S, A, cuyas longitudes son respectivamente 2, 1, 1. PROBABILIDAD Y ESTADÍSTICA II 8 1.2 EVENTOS MUTUAMENTE EXCLUYENTES Dada una experiencia aleatoria con espacio muestral V, se dice que dos eventos A y B (que pertenecen a V) son mutuamente excluyentes si no pueden ocurrir simul- táneamente; es decir, si ocurre A no ocurre B y a la inversa, si ocurre B no ocurre A. Ejemplos a) Decir que dos eventos son mutuamente excluyentes equivale a decir que su conjunción es vacía, lo cual se simboliza de la siguiente manera: A > B 5 Φ, donde Φ representa el evento imposible (conjunto vacío). Al representar dos eventos en un diagrama de Venn se deben ver separados, esto indica que no tienen elementos en común, como en el siguiente diagrama: A B Ω b) Se lanza un dado. Los eventos “ocurre 2 o 4” y “ocurre un número impar” son mutuamente excluyentes, ya que si después de lanzar el dado ocurrió 2, en- tonces no ocurrió número impar; si ocurrió 4 tampoco ocurrió número impar, etcétera. 1.2.1 Regla de la adición Cuando dos eventos son mutuamente excluyentes, la probabilidad de la unión es la suma de las probabilidades, es decir: P(A < B) 5 P(A) 1 P(B) Si los eventos no son mutuamente excluyentes, se tiene la ecuación: P(A < B) 5 P(A) 1 P(B) 2 P(A > B) Gráfi ca 1.2 1. Con base en el primer párrafo del artículo sobre hipertensión, aproximadamente ¿cuántas muertes por esta enfermedad ocurren cada año en los países en desarrollo? 2. ¿Cuál es la probabilidad de que durante un año alguien en el mundo muera por hipertensión arterial? 3. Se lanza una moneda cuatro veces y se observan dos variables: a) el número de “soles” que ocurren y b) la longitud de la cadena más larga ¿Cuál es la probabilidad de que se obtengan dos soles y de que la cadena más larga sea 2? 4. Se lanzan dos dados, uno rojo y otro azul, y se observan los resultados. Sea A el evento “que la suma sea 6, 7 u 8” y B el evento “que el resultado del dado rojo sea 1, 2 o 3”. ¿Cuál es la probabilidad de A y B? Evaluación formativa PROBABILIDAD CONJUNTA 9 Una ventana al conocimiento Para ver esta propiedad considera lo siguiente: Primero defi nimos la diferencia entre dos conjuntos de la siguiente forma (A 2 B) 5 “Los elementos que están en A y que no están en B”; en un diagrama de Venn este conjunto se representa como en la página 1.6: Entonces se tienen las siguientes igualdades: A 5 (A 2 B) < (A > B), donde los eventos (A 2 B) y (A > B) son ajenos. B 5 (B 2 A) < (A > B), donde los eventos (B 2 A) y (A > B) son ajenos. A < B 5 (A 2 B) < (B 2 A) < (A > B), donde los eventos (A 2 B), (B 2 A), (A > B) son mutuamente excluyentes. Por tanto, al sacar la probabilidad a ambos miembros de cada una de las anteriores igualdades y al aplicar la regla de que para eventos ajenos la probabilidad de una suma es la suma de las probabilidades se tiene: P(A) 5 P(A 2 B) 1 P(A > B) (1) P(B) 5 P(B 2 A) 1 P(A > B) (2) P(A<B) 5 P(A 2 B) 1 P(B 2 A) 1 P(A > B) (3) Por lo tanto, sumando (1) y (2) y restando (3) se obtiene: P(A) 1 P(B) 2 P(A < B) 5 P(A > B) de donde P(A<B) 5 P(A) 1 P(B) 2 P(A > B). A B A 2 B 1. En una población de personas adultas se han considerado tres valores de la variable “estado civil” y se encuentran en los porcentajes siguientes: solteros (50%), casados (30%) y divorciados (20%). ¿Son los eventos “ser soltero” y “ser divorciado” mutuamente excluyentes? ¿Cuál es la probabilidad de que alguien de esa población sea soltero o divorciado? 2. Se lanza un dado y es A el evento “el número de la cara que ocurre es un número par” y B el evento “el número de la cara que ocurre es un número primo”. ¿Son los eventos mutuamente excluyentes? ¿Cuál es la probabilidad de que al menos uno de ellos ocurra? 3. En una experiencia aleatoria se tienen dos eventos A y B con P (A ) 5 1/3; P (B ) 5 1/4; P (A < B ) 5 1/2. Hallar P (A > B ). 4. Si se tienen tres eventos A, B, C de una experiencia aleatoria, se puede defi nir el evento “que ocurra al menos uno de los tres eventos”; y se simboliza así: A < B < C. Hay una fórmula para la probabilidad de A < B < C en términos de las siguientes probabilidades: P (A ), P (B ), P (C ), P (A > B ), P (A > C ), P (B > C ) y P (A > B > C ) Investiga cuál es esa fórmula. Evaluación formativa PROBABILIDAD Y ESTADÍSTICA II 10 Una ventana al conocimiento Leyes de Mendel (1865) • Primera ley o Principio de la uniformidad: “Cuando se cruzan dos individuos de raza pura, los híbridos resultantes son todos iguales entre sí.” El cruce de dos individuos homocigotas, uno dominante (AA) y otro recesivo (aa), origina sóloindividuos heterocigotas, es decir, los individuos de la primera generación fi lial son uniformes entre ellos (Aa). • Segunda ley o Principio de la segregación: “Ciertos individuos son capaces de transmitir un carácter aunque en ellos no se manifi este.” El cruce de dos individuos de la F1 (Aa) dará origen a una segunda generación fi lial en la cual reapa- rece el fenotipo “a”, a pesar de que todos los individuos de la F1 eran de fenotipo “A”. Esto hace presumir a Mendel que el carácter “a” no había desaparecido, sino que sólo había sido “opacado” por el carácter “A”, pero que al reproducirse un individuo, cada carácter segrega por separado. • Tercera ley o Principio de la transmisión independiente: Esta ley hace referencia al cruce polihíbrido (monohíbri- do: cuando se considera un carácter; polihíbrido: cuando se consideran dos o más caracteres). Mendel trabajó este cruce en guisantes, en los cuales las características que él observaba (color de la semilla y rugosidad de su superfi cie) se encontraban en cromosomas separados. De esta manera, observó que los caracteres se transmi- tían independientemente unos de otros. Esta ley, sin embargo, deja de cumplirse cuando existe linkage (dos genes estan en loci muy cercanos y no se separan en la meiosis). NOTA: Algunos autores obvian la Primera Ley de Mendel, y por tanto llaman Primera Ley al Principio de la segregación y Segunda Ley al Principio de la transmisión independiente (para estos mismos autores, no existe una Tercera Ley). Experimentos de Mendel Mendel inició sus experimentos eligiendo dos plantas de guisantes que diferían en un carácter, cruzó una variedad de planta que producía semillas amarillas con otra que producía semillas verdes, estas plantas forman la generación parental (P). Como resultado de este cruce se produjeron plantas que producían nada más que semillas amarillas; repitió los cruces con otras plantas de guisante que diferían en otros caracteres y el resultado era el mismo: se producía un carácter de los dos en la generación fi lial. Al carácter que aparecía le llamó Dominante y al que no, recesivo. En este caso el color ama- rillo es dominante frente al color verde. Las plantas obtenidas de la generación parental se denominan primera generación fi lial (F1). Mendel dejó que se autofecundaran las plantas de la primera generación fi lial y obtuvo la segunda generación fi lial (F2) compuesta por plantas que producían semillas amarillas y plantas que producían semillas verdes en una proporción 3:1 (3 de semillas amarillas y 1 de semillas verdes). Repitió el experimento con otros caracteres diferenciados y obtuvo resultados similares en una proporción 3:1. De esta experiencia sacó la primera y segunda leyes. Más adelante, Mendel decidió comprobar si estas leyes funcionaban en plantas diferenciadas en dos o más caracteres, eligió como generación parental plantas de semillas amarillas y lisas y plantas de semillas verdes y rugosas. Las cruzó y obtuvo la primera generación fi lial compuesta por plantas de semillas amarillas y lisas, la primera ley se cumplía: en la F1 aparecían los caracteres dominantes (amarillos y lisos) y no los recesivos (verde y rugosos). Obtuvo la segunda generación fi lial autofecundando la primera generación fi lial y obtuvo semillas de todos los estilos po- sibles, plantas que producían semillas amarillas y lisas, amarillas y rugosas, verdes y lisas y verdes y rugosas, las contó y probó con otras variedades y se obtenían en una proporción 9:3:3:1 (9 plantas de semillas amarillas y lisas, 3 de semillas amarillas y rugosas, 3 de semillas verdes y lisas y una planta de semillas verdes y rugosas). De esta experiencia dedujo la Tercera Ley de Mendel. [Tomado de: http://es.wikipedia.org/wiki/Gregor_Mendel] PROBABILIDAD CONJUNTA 11 1.3 EVENTOS INDEPENDIENTES Dado un experimento aleatorio con espacio muestral V, se dice que dos eventos A y B (que pertenecen a V) son independientes si la ocurrencia de A no modifi ca la probabilidad de la ocurrencia de B y a la inversa, la ocurrencia de B no modifi ca la probabilidad de la ocurrencia de A. Ejemplo Se lanza un dado. Sea A el evento “ocurre número par” y B el even- to “ocurre un número múltiplo de 3”. ¿Son independientes A y B? Para que se entienda la expresión de que “la ocurrencia de A no modifi ca la probabilidad de la ocurrencia de B” piensa de la si- guiente manera: Juan y Pablo juegan a los dados. Juan gana si ocurre el evento B. Pablo lanza el dado y cae en un lugar en el que Juan no puede ver el resultado, pero Pablo sí lo ve. Juan le pregunta a Pablo: ¿qué ocurrió? Pablo le responde: “ocurrió el evento B”. Como Juan no sabe si ocurrió o no el evento A, sigue en incertidumbre, pero ahora sabe que el resultado es “un múltiplo de 3” (evento B); con esta información se pregunta: ¿tengo más, menos o igual probabilidad de que “ocurra un número par” (evento A)? Para responder esta pregunta se debe hacer el siguiente análisis: Como ocurrió el evento B, se sabe que el resultado es 3 o 6 (múl- tiplos de 3). Entonces la probabilidad de que ocurra el evento A 5 “sale un número par”, con la información de que ocurrió el evento B, es 1/2. Esto se escribe así: P(A | B) 5 1/2 y se lee “la probabilidad de A dado que B ocurre es igual a un medio”. Pero la probabilidad original de que ocurra el evento A es exac- tamente 3 sobre 6, que es igual a 1/2. Como la ocurrencia del evento B no modifi có la probabilidad de ocurrir del evento A, A y B son independientes. Si la probabilidad del evento B es diferente de cero, la condición de independencia se puede reformular así: A y B son independientes si P(A | B) 5 P(A) Evaluación formativa 1. En sus experimentos sobre las leyes de la herencia, Mendel empleó el cruzamiento de plantas con diferentes caracteres para observar los de las plantas descendientes. Propuso fi jarse en las semillas de plantas, por ejemplo chícharos o guisantes, y observar dos variables: forma y color de la semilla. PROBABILIDAD Y ESTADÍSTICA II 12 La forma puede tomar dos valores: liso y rugoso. El color también puede tomar dos valores: amarillo y verde. Una primera observación es: a ) Que el evento “la semilla de un descendiente es rugosa” es mutuamente excluyente del evento “la semilla de un descendiente es lisa”. b ) El evento “la semilla de un descendiente es amarilla” es mutuamente excluyente del evento “la semilla de un descendiente es verde”. Una de sus conclusiones afi rma que la forma de la semilla es independiente de su color; es decir, a ) El evento “un descendiente tiene forma rugosa” es independiente del evento “un descendiente tiene semilla color amarilla”. b ) El evento “un descendiente tiene forma lisa” es independiente del evento “un descendiente tiene semilla color amarilla”. c ) El evento “un descendiente tiene forma rugosa” es independiente del evento “un descendiente tiene semilla color verde”. d ) El evento “un descendiente tiene forma lisa” es independiente del evento “un descendiente tiene semilla color verde”. En un experimento cruzó plantas con ambos tipos de semilla y a los descendientes los autofecundó para obtener una segunda generación, de la cual resultaron 556 semillas: 315 lisas y amarillas; 108 lisas y verdes. Si se sabe que las características son independientes, ¿cuántas semillas “rugosas y amarillas” y cuántas “rugosas y verdes” se esperan? Utiliza la siguiente notación: A: semilla color amarilla V: semilla color verde L: semilla lisa R: semilla rugosa 2. El tirador A pega 80% de las veces a una zona del blanco. El tirador B pega 90% de las veces en la misma zona del blan- co. Cuando ambos tiradores disparan hacia el mismo blanco, ¿cuál es la probabilidad de que los dos disparos peguen en el blanco? 3. La fabricación de un producto pasa por dos procesos: uno reali- zado por una máquina A y otro por una máquina B. Hay 5% de probabilidad de que la máquina A produzca un defecto y 3% de que la máquinaB lo produzca. Si se desecha un producto cuando tiene defectos de ambos procesos, ¿cuál es la probabilidad de desechar un producto? PROBABILIDAD CONJUNTA 13 1.4 PROBABILIDAD CONDICIONAL El valor de una tirada El nacimiento de la probabilidad se asocia con el nombre de Pascal. Varios historiadores (Todhunter, 1865; Hald, 1990) narran que el Caballero de Méré (un hombre culto afi cionado a los casinos) le propuso varios problemas de juegos de azar a Pascal, que a su vez los discutió por correspondencia con Fermat en 1654. El plantea- miento de uno de ellos no aparece en las cartas que aún se conser- van, pero gracias a la respuesta que da Fermat a Pascal se infi ere que debe ser semejante al siguiente: Una apuesta se juega entre dos personas de la manera siguiente: uno de ellos va a arrojar el dado ocho veces y si obtiene al me- nos una vez la cara marcada con el seis se lleva la apuesta, en caso contrario se la lleva su oponente. Si el primer jugador re- nuncia de antemano a su cuarta tirada, ¿qué parte de la apuesta se le debe retribuir? O, en otros términos, ¿cuál es el valor de esa cuarta tirada? Esta forma de preguntar es muy diferente del modo en que ahora se formulan en probabilidad. Sin embargo, es interesante observar que la pregunta se refi ere al valor de una tirada para la persona que arroja los dados. El valor que se quiere encontrar es la medida de un evento. El evento en cuestión es ganar todo el juego exac- tamente en la cuarta tirada, es decir, “obtener un 6 exactamente en la cuarta tirada y no antes”. El pago que recibiría el jugador es lo que se llamó el valor de la cuarta tirada. La solución de Fermat es la siguiente: Si tengo que obtener al menos un seis en ocho lanzamientos; y si, después de hechas las apuestas, coincidimos que no haré el primer lanzamiento, entonces, de acuerdo [con] mi teoría, debo tomar en compensación 1/6 de la suma total por este primer lanzamiento. Una manera de entender el signifi cado de “tomar en compensación” una cantidad por “no hacer el primer lanzamiento” es imaginar que el primer jugador vende su primera tirada. ¿Cuánto tiene que pagar el segundo jugador por esa tirada? La res- puesta es 1/6 de la apuesta que está en juego. Fermat continúa: Si además coincidimos que no haré el segundo lanzamiento, debo en compensa- ción obtener una sexta parte del resto que viene a ser 5/36. La idea aquí es calcular el valor de las dos primeras tiradas. Es curiosa la manera en que la calcula Fermat como 1/6 del resto. Como en la primera tirada se había quitado de la apuesta 1/6, quedan 5/6. Fermat dice que el valor de esta segunda tirada es 1/6 de lo que queda, es decir, 1/6 por 5/6, que es igual a 5/36. PROBABILIDAD Y ESTADÍSTICA II 14 Si, después de esto, coincidimos en que no hago el tercer lanzamiento, debo tener, de indemnización, un sexto de la cantidad restante, es decir, debo obtener 25/216 del total. Lo que queda de la apuesta original después de “la venta” de las dos primeras tiradas es: 5/6 2 5/36 5 30/36 25/36 5 25/36; una sexta parte de esto es 25/216. Y después de que coincidimos, nuevamente, que no haré el cuarto lanzamiento, debo otra vez tener un sexto de lo que es dejado, que es 125/1296 del total, y coincido con usted en que éste es el valor del cuarto lanzamiento, suponiendo que uno ya se ha arreglado sobre los lanzamientos previos. Fermat percibió que el valor de la cuarta tirada está relacionado con los valores de las tres tiradas previas; en particular, si ocurriera el 6 en algunas de las tres primeras, la cuarta pierde valor, pues la apuesta sería tomada por el primer jugador. Si no ocurriera el 6 en ninguna de las tres primeras tiradas, el valor de la cuarta sería 1/6. Al leer la respuesta de Fermat a Pascal se deduce que este último no había distinguido bien la diferencia entre el valor de la tirada al principio del juego y el valor de la cuarta tirada una vez transcurridos los tres primeros resultados. Al fi nal, concordaron que el procedimiento de Fermat era la solución correcta. Evaluación formativa Pedro gira una ruleta, como la de la gráfi ca 1.3, cuatro veces y gana si la fl echa señala rojo al menos una vez. ¿Cuál es el valor de su tercera tirada? 1.4.1 Fórmula de la probabilidad condicional El problema general de este capítulo es: ¿cómo se modifi ca la probabilidad de un evento si se puede contar con la información de que otro evento ocurre? La diferencia entre Fermat y Pascal sobre cómo considerar el valor de la cuarta jugada lo ilustra: Fermat estableció el valor de la cuarta jugada al principio del juego; mientras que, al parecer, Pascal pensó en el valor de la cuarta jugada una vez realiza- das las tres primeras, pero llegaba al mismo resultado: 125/1296. Fermat notó que el valor de la cuarta tirada, una vez realizadas las tres primeras, en las cuales no salió 6, debe ser simplemente 1/6; ésta es una probabilidad condicional. Gráfi ca 1.3 PROBABILIDAD CONJUNTA 15 Defi nición. Sean A y B dos eventos de una experiencia aleatoria, de modo que P(A) . 0; la probabilidad condicional de B dado que A ocurre, que se simboliza con la expresión P(B | A), se defi ne como: P(B | A) 5 P(A > B) P(A) Con un diagrama de Venn se puede representar el concepto de probabilidad con- dicional. Grafi quemos dos eventos A y B en un diagrama: A B Ω Gráfi ca 1.4 Suponer que el evento A ha ocurrido signifi ca reducir el espacio muestral al even- to A, que ahora iluminamos en el diagrama: A B Ω Gráfi ca 1.5 En este nuevo espacio muestral el evento B queda reducido a la intersección A > B: Ω 5A B5A y B Gráfi ca 1.6 PROBABILIDAD Y ESTADÍSTICA II 16 por ello la probabilidad de B es simplemente el cociente entre la probabilidad de la intersección y la probabilidad de A. Ejemplos 1. Dos personas juegan a lanzar un dado dos veces sucesivas. El primer jugador gana si la suma de los puntos de las caras es mayor que o igual a 7. En otro caso, gana el segundo jugador. a) ¿Cuál es la probabilidad de que gane el primer jugador? b) Si se realiza el primer lanzamiento y sale la cara con 3 puntos, ¿cuál es la probabilidad de que el primer jugador gane? Solución: a) Hay que tener en cuenta el espacio muestral del lanzamiento de dos dados: (1, 1), (2, 1), (3, 1), (4, 1), (5, 1), (6, 1) (1, 2), (2, 2), (3, 2), (4, 2), (5, 2), (6, 2) (1, 3), (2, 3), (3, 3), (4, 3), (5, 3), (6, 3) (1, 4), (2, 4), (3, 4), (4, 4), (5, 4), (6, 4) (1, 5), (2, 5), (3, 5), (4, 5), (5, 5), (6, 5) (1, 6), (2, 6), (3, 6), (4, 6), (5, 6), (6, 6) El evento G “la suma es mayor o igual a 7” está formado por los elementos de la parte sombreada del espacio muestral que se presenta en seguida: (1, 1), (2, 1), (3, 1), (4, 1), (5, 1), (6, 1) (1, 2), (2, 2), (3, 2), (4, 2), (5, 2), (6, 2) (1, 3), (2, 3), (3, 3), (4, 3), (5, 3), (6, 3) (1, 4), (2, 4), (3, 4), (4, 4), (5, 4), (6, 4) (1, 5), (2, 5), (3, 5), (4, 5), (5, 5), (6, 5) (1, 6), (2, 6), (3, 6), (4, 6), (5, 6), (6, 6) De donde la probabilidad de que gane el primer jugador es: P(G) 5 21/36 57/12. b) Si al lanzar el primer dado ocurre el 3, el espacio muestral se reduce a la parte sombreada que se presenta a continuación: PROBABILIDAD CONJUNTA 17 (1, 1), (2, 1), (3, 1), (4, 1), (5, 1), (6, 1) (1, 2), (2, 2), (3, 2), (4, 2), (5, 2), (6, 2) (1, 3), (2, 3), (3, 3), (4, 3), (5, 3), (6, 3) (1, 4), (2, 4), (3, 4), (4, 4), (5, 4), (6, 4) (1, 5), (2, 5), (3, 5), (4, 5), (5, 5), (6, 5) (1, 6), (2, 6), (3, 6), (4, 6), (5, 6), (6, 6) De este nuevo espacio muestral, G gana si ocurre (3, 4), (3, 5) o (3, 6); es decir, con probabilidad 3/6 5 1/2. Si llamamos T al evento “ocurre en el primer dado la cara tres”, se tiene: P(G | T ) 5 1/2 Observaciones: G > T es el evento “mayor que o igual a 7 y el primer dado cae 3”; hay tres elementos que lo cumplen, de donde: P(G > T)5 3/3651/12. Además, como P(T) 5 6/36 5 1/6, al aplicar la fórmula de probabilidad con- dicionalse tiene: P(G | T ) 5 P(G > T)/P(T) 5 (1/12) / (1/6) 5 6/12 5 1/2 Noten que el que haya ocurrido 3 en el primer lanzamiento no fue lo mejor para el primer jugador, pues su probabilidad original de ganar era 7/12, pero después del primer lanzamiento en el que ocurrió 3, su probabilidad de ganar disminuye a 1/2. 2. Mediante estadísticas es posible calcular la probabilidad de que una persona tomada al azar de una población padezca de presión alta; sería el cociente de las personas que sufren de presión alta entre el total de la población. Sin embargo, dicha probabilidad puede aumentar o disminuir si se considera cierta informa- ción. Por ejemplo, si se observa sólo a los mayores de 60 años, la probabilidad de presión alta para este grupo no será la misma que para toda la población. Si se denota con A el evento de tener la presión alta, P(A) será la probabilidad de que una persona al azar tenga presión alta. Si se denota con E el evento de “ser mayor de 60 años”, P( A | E) será la probabilidad de que una persona tenga presión alta dado que tiene más de 60 años. Para calcular esta probabilidad bastaría saber el número de personas que tienen presión alta de entre los mayores de 60 años y dividirlo entre el número de personas mayores de 60 años; P A E( | ) # 5 de personas con presión alta y mayorres de 60 de personas mayores de 60 años# PROBABILIDAD Y ESTADÍSTICA II 18 Al dividir el numerador y el denominador entre el total de la población se en- cuentra una expresión más cómoda en términos de probabilidades: (P AA E| ) # 5 de personas con presión alta y mayorees de 60 Total de la población de personas# mmayores de 60 años Total de la población 5 P(AA E P E > ) ( ) Hemos visto que hay eventos que son mutuamente excluyentes, esto signifi ca que si ocurre uno no puede ocurrir el otro y viceversa. Evaluación formativa 1. En los estudios socioeconómicos se suelen clasifi car las familias en diferentes niveles de acuerdo con algunas variables, como “posesión de auto” o “posesión de computadora”, entre otras. Ver por ejemplo: http://www.amai.org/pdfs/revista-amai/revista-amai-articulo-20050427_132827.pdf Cierto estudio arroja que en una ciudad 40% de las familias tiene auto, 50% computadora y 35% auto y computadora. Si se elige una familia al azar de esa ciudad, responde: a ) ¿Cuál es la probabilidad de que alguien que tenga auto tenga computadora? b ) ¿Cuál es la probabilidad de que alguien que tenga compu- tadora tenga auto? 2. Una moneda bien balanceada se lanza tres veces. ¿Cuál es la probabilidad de obtener tres águilas dado que al menos ocurrieron dos águilas? 3. Se elige en forma aleatoria un número del 1 al 21. ¿Cuál es la probabilidad de que sea divisible entre 3 dado que no es divisible entre 2? 1.4.2 Regla del producto Con base en la fórmula de la probabilidad condicional: P(B | A) 5 P(A > B) P(A) Por simple despeje, se puede obtener la fórmula para la conjunción de dos eventos: P(A > B) 5 P(A) 3 P(B | A) Se lee: “La probabilidad conjunta de A y B es igual a la probabilidad de A por la probabilidad condicional de B dado que ocurrió A”. PROBABILIDAD CONJUNTA 19 Un ejemplo ilustrará cómo se utiliza esta fórmula. Una urna tiene 10 bolas negras y 5 bolas blancas. Se extraen sucesivamente y sin reemplazo dos bolas de la urna. ¿Cuál es la probabilidad de que las dos sean blancas? Sea B 1 el evento de que en la primera extracción se obtenga bola blanca: P(B 1 ) 5 5/15 5 1/3. Sea B 2 el evento de que en la segunda extracción se obtenga bola blanca. En lugar de calcular la pro- babilidad de B 2 , es más fácil calcular la probabilidad condicional de B 2 dado que ocurre B 1 . Esta probabi- lidad es 4/14, pues del evento B 1 se deduce que a la urna original se le sacó una bola blanca y quedan 4 blancas de un total de 14. El evento de que ambas bolas sean blancas es: B 1 > B 2 , entonces, por la regla del producto se tiene: P(B 1 > B 2 ) 5 P(B 1 ) × P(B 2 | B 1 ) 5 5/15 3 4/14 En el ejemplo anterior, P(B 2 | B 1 ) no se calculó mediante la fórmula, sino observando la situación de la urna después de haber ocurrido B 1 . De haber intentado calcular B 2 mediante la fórmula se hubiera caído en un círculo vicioso, se necesitaría P(B 1 > B 2 ) lo cual precisamente se quería calcular. La regla del producto puede representarse en un diagrama como el que aparece abajo. Al fi nal de cada rama aparece un evento y sobre la rama la probabilidad del evento dado que ocurrió el evento al comienzo de la rama. Las dos primeras ramas no tienen eventos al comienzo, pero sí las siguientes. Para obtener la probabilidad con- junta de dos eventos basta multiplicar las probabilidades de las ramas que los juntan. En el extremo derecho aparecen las probabilidades de P(A > B 1 ), P(Ac > B 1 ), P(A > B 2 ), P(Ac > B 2 ), respectivamente: P(A | B 1 ) A P(B 1 )P(A | B 1 ) B 1 P(Ac | B 1 ) Ac P(B 1 )P(Ac | B 1 ) P(B 1 ) P(B 2 ) P(A | B 2 ) A P(B 2 )P(A | B 2 ) B 2 P(Ac | B 2 ) Ac P(B 2 )P(Ac | B 2 ) Gráfi ca 1.7 PROBABILIDAD Y ESTADÍSTICA II 20 Ejemplo Una caja A contiene tres bolas numeradas del 1 al 3 y otra caja B contiene 4 bolas numeradas del 1 al 4. Si al lanzar un dado cae la cara con 6 puntos, se elige la caja A y de ella se saca una bola al azar. Si el dado no cae con la cara de 6 puntos, se elige la caja B y de ella se saca una bola al azar. ¿Cuál es la probabilidad de elegir la caja A y obtener una bola con número par?, ¿y cuál es la probabilidad de elegir la caja A y obtener impar?, ¿cuál es la pro- babilidad de elegir la caja B y obtener par?, ¿cuál la de elegir la caja B y obtener impar? Con el diagrama se puede representar el proble- ma de la siguiente forma: 1 6 1 3 2 3 5 6 1 2 1 2 Gráfi ca 1.8 Par 1 6 1 3 3 3 2 1 Caja A Impar 1 6 2 3 3 Par 5 6 1 2 3 2 4 3 Caja B 1 Impar 5 6 1 2 3 En la columna de la derecha aparecen las expresiones de las probabilidades soli- citadas, de donde: La probabilidad de elegir la primera urna y obtener par es: 1/18. La probabilidad de elegir la primera urna y obtener impar es: 2/1851/9 La probabilidad de elegir la segunda urna y obtener par es: 5/12 La probabilidad de elegir la segunda urna y obtener impar es: 5/12 PROBABILIDAD CONJUNTA 21 1. De los estudiantes de una escuela de bachillerato, 1/3 son hombres y 2/3 son mujeres. Una encuesta reveló que 1/5 de los hombres y 2/7 de las mujeres elegirán una carrera en la opción de ciencias. Si se elige un estudiante al azar, ¿cuál es la probabilidad de que sea hombre y quiera estudiar una carrera en la opción de ciencias? ¿Cuál es la probabilidad de que sea mujer y no elija una carrera en la opción de ciencias? 2. Si P(E ) 5 1/4, P (F | E ) 5 1/2 y P (E | F ) 5 1/3, calcula P (F ). 3. La probabilidad de sobrevivir a una operación es 0.9. Si se supera la operación, la probabilidad de no recobrar la salud es de 0.2. ¿Cuál es la probabilidad de sobrevivir a la operación y recobrar la salud? 4. Una caja A contiene 10 bolas numeradas del 1 al 10 y otra caja B contiene 20 bolas numeradas del 1 al 20. Si se lanza un dado y cae una cara con 1 o 2 puntos, se elige la caja A y de ella se saca una bola al azar. Si la cara del dado no es la de 1 o 2 puntos, entonces se elige la caja B y de ella se saca una bola al azar. ¿Cuál es la probabilidad de elegir la caja A y obtener un múltiplo de 3?, ¿y cuál la de elegir la caja A y obtener impar? ¿Cuál es la proba- bilidad de elegir la caja B y obtener un múltiplo de 3?, ¿y cuál la de elegir la caja B y obtener impar? Evaluación formativa 1.4.3 Probabilidad total En una experiencia aleatoria con espacio muestral V, un par de eventos B 1 y B 2 for- man una partición del espacio muestral si se cumple lo siguiente: a) B 1 > B 2 5 Φ b) B 1 < B 2 5 V Una partición B 1 y B 2 se puede representar en un diagrama de Venn comosigue: B1 B2 Ω Gráfi ca 1.9 PROBABILIDAD Y ESTADÍSTICA II 22 Cualquier evento en ese espacio muestral se puede dividir en dos partes: una perteneciente a B 1 y otra a B 2 , esta idea se expresa simbólicamente de la siguiente manera. Sea A un evento de V y B 1 y B 2 una partición, entonces A se puede expresar así: A 5 (A > B 1 ) < (A > B 2 ) (1) Donde los eventos (A > B 1 ) y (A > B 2 ) no tienen elementos en común. Lo anterior se puede representar en un diagrama de Venn como el que aparece a continuación, donde la elipse representa el evento A, el cual está dividido en dos par- tes: una dentro de B 1 , que se representa por A > B 1 ; otra dentro de B 2 que se representa por A > B 2 : B1 B2 Ω A A y B1 A y B2 Gráfi ca 1.10 Con base en la expresión: A 5 (A > B 1 ) < (A > B 2 ) se tiene lo siguiente: P(A) 5 P(A > B 1 ) 1 P(A > B 2 ) Por la regla del producto P(A > B 1 ) 5 P(B 1 ) P(A | B 1 ) y P(A > B 2 ) 5 P(B 2 ) P(A | B 2 ) y se tiene: P(A) 5 P(B 1 ) P(A | B 1 ) 1 P(B 2 ) P(A | B 2 ) (2) La expresión (2) es la fórmula de la probabilidad total. Ejemplos 1. La probabilidad de que un alumno estudie para una prueba es 0.7 (y de que no estudie es 0.3). Si estudia, pasa la prueba con probabilidad de 0.8; si no estudia, pasa con probabilidad 0.4. ¿Cuál es la probabilidad de que el estudiante pase la prueba? PROBABILIDAD CONJUNTA 23 Defi namos los siguientes eventos: A 5 “el estudiante pasa la prueba”. B 1 5 “el estudiante estudia para la prueba”. B 2 5 “el estudiante no estudia para la prueba”. Obsérvese que B 1 y B 2 son una partición del espacio muestral. Se tiene que: P(A | B 1 ) 5 0.8; P(A | B 2 ) 5 0.4; P(B 1 ) 5 0.7; P(B 2 ) 5 0.3 Entonces: P(A) 5 (0.7)(0.8) 1 (0.3)(0.4) 5 0.68 2. Sean U 1 y U 2 dos urnas. U 1 contiene 20 bolas negras y 10 azules; mientras que U 2 contiene 5 bolas negras y 15 azules. U1 U2 Gráfi ca 1.11 Si se lanza un dado, puede suceder lo siguiente: Si cae {1, 2}, de la urna 1 se extrae una bola al azar. Si cae {3, 4, 5, 6}, de la urna 2 se extrae una bola al azar. ¿Cuál es la probabilidad de que la bola sea negra? Sea B 1 el evento “elegir la urna U 1 ” y B 2 el evento “elegir la urna U 2 ”. B 1 y B 2 forman una partición. Sea A el evento sacar una bola negra. Entonces: P(B 1 ) 5 1 3 ; P(B 2 ) 5 2 3 ; P(A |B 1 ) 5 20 30 5 2 3 ; P(A|B 2 ) 5 5 15 5 1 3 Por la fórmula de la probabilidad total: P(A) 5 P(B 1 ) P(A |B 1 ) 1 P(B 2 ) P(A|B 2 ) 5 (1/3)(2/3) 1 (2/3)(1/3) 5 2/9 1 2/9 5 4/9 3. La fórmula de la probabilidad total también se puede obtener del árbol que se diseñó en la sección anterior; sólo que ahora debe entenderse que la probabili- PROBABILIDAD Y ESTADÍSTICA II 24 dad del evento A es la suma de la probabilidad de las trayectorias que llevan al evento: P(A | B 1 ) A B 1 P(B 1 ) P(Ac | B 1 ) Ac P(B 1 ) P(A | B 1 ) 1 P(B 2 ) P(A | B 2 ) P(B 2 ) P(A | B 2 ) A B 2 P(Ac | B 2 ) Ac Gráfi ca 1.12 Por ejemplo, el problema 1 de esta sección se representa como sigue en el árbol: 0.8 Pasar Estudiar 0.7 0.2 No pasar (0.7)(0.8) 1 (0.3)(0.4) 5 0.68 0.3 0.4 Pasar No estudiar 0.6 No pasar Gráfi ca 1.13 Problemas 1. De los estudiantes de una escuela de bachillerato, 1/3 son hombres y 2/3 son mujeres. Una encuesta reveló que 1/5 de los hombres y 2/7 de las mujeres ele- girán una carrera en la opción de ciencias. ¿Cuál es la probabilidad de que una persona elegida al azar escoja una carrera en la opción de ciencias? 2. La urna A tiene tres bolas blancas y una negra. La urna B tiene tres bolas negras y una blanca. Si al lanzar un dado cae una cara con un número de puntos múl- tiplo de 3, se elige la urna A y de ella se saca una bola al azar. En otro caso, se elige la urna B y de ella se saca una bola al azar. ¿Cuál es la probabilidad de que la bola extraída sea blanca? 3. En una fábrica hay dos máquinas A y B. La máquina A hace 40% de la pro- ducción, de la cual 2% son artículos defectuosos. La máquina B realiza 60% de la producción, de la cual 1% son artículos defectuosos. Si se elige al azar un objeto producido en la fábrica, ¿cuál es la probabilidad de que sea defectuoso? PROBABILIDAD CONJUNTA 25 1.4.4 Teorema de Bayes (versión simple) Ya hemos visto que en una experiencia aleatoria con espacio muestral V, si se tiene una partición B 1 , B 2 y un evento cualquiera A, la probabilidad de A se puede expresar como: P(A) 5 P(B 1 ) P(A | B 1 ) 1 P(B 2 ) P(A | B 2 ) (3) Ahora supongamos que se está interesado en la probabilidad condicional “de un evento de la partición, digamos B 1 , dado que ocurre A”, es decir, en P(B 1 | A); por defi nición: P(B 1 | A) 5 P(B 1 > A) P(A) Entonces, si se sustituye P(B 1 > A) por P(B 1 )P(A | B 1 ) y P(A) por la expresión (3) se obtiene: P(B 1 ) P(A | B 1 ) [P(B 1 ) P(A | B 1 ) 1 P(B 2 ) P(A | B 2 )] (4) Aprender a ser con la probabilidad y la estadística Una mujer de 40 años se practicó una mastografía y el resultado fue positivo. Esto signifi ca que tiene cáncer de mama. Aunque un examen para detectar cáncer resulte positivo, no siempre es verdad. Esto se debe a que en todos los instrumentos hay un grado de incertidumbre. Se estima que una mujer que se realizó mamogramas anuales entre los 40 y 49 años de edad tiene una probabilidad de 30% de obtener un resultado falso positivo en algún punto durante esa década y aproxi- madamente una probabilidad de 7 a 8% de realizar una biopsia de mamas dentro de ese periodo. Se estima una probabilidad de 25% de tener un mamograma falso positivo en mujeres de 50 años o mayores. http://www.radiologyinfo.org/sp/info.cfm?pg=mammo&bhcp=1 Defi nir los eventos A, B, C, . . . A = Una mujer obtuvo diagnóstico positivo al hacerse un mamograma. B = Una mujer se realizó un mamograma anual durante sus 40 y 49 años. C = Una mujer es mayor de 50 años. Haz lo siguiente: 1. Interpreta e indica la probabilidad de P(A/B) y P(A/C). 2. Averigua en internet el signifi cado de un mamograma. 3. Investiga en internet lo que es el cáncer de próstata. 4. Consigue datos similares a los citados al inicio de esta sección acerca de mamografías. P(B 1 | A) 5 PROBABILIDAD Y ESTADÍSTICA II 26 A la expresión (4) se le llama fórmula de Bayes. Aunque el teorema de Bayes tiene una forma más compleja, pues en lugar de una partición de dos eventos B 1 , B 2 se puede formular para una partición de muchos even- tos, aquí nos conformaremos con esta versión simple con la convicción de que si al es- tudiante le queda clara ésta, le será fácil comprender y aplicar la versión más general. Ejemplos 1. En una compañía de seguros, 30% de los agentes de ventas son hombres y 70% mujeres. Se sabe que 10% de los agentes hombres y 15% de los agentes mujeres padecen estrés. Se elige una persona al azar de la población y se detecta que tiene estrés. ¿Cuál es la probabilidad de que sea una mujer? B 1 5 “ser hombre” B 2 5 “ser mujer” E 5 “tener estrés” Se quiere saber P(B 2 | E); entonces, por la fórmula de Bayes: P(B 2 | E) 5 P(B 2 ) P(E | B 2 ) /[P(B 1 ) P(E | B 1 ) 1 P(B 2 ) P(E | B 2 )] (5) Por el enunciado del problema se sabe que: P(B 1 ) 5 0.3; P(B 2 ) 50.7; P(E | B 1 ) 5 0.1; P(E | B 2 ) 5 0.15 Entonces: 2. Los elementos del teorema de Bayes también se pueden ver en un diagrama de árbol, aunque hay que visualizar más operaciones de las que se pueden repre- sentar directamente en él: P(B 1 | A) 5 P(B 1 )P(A | B 1 ) P(B 1 )P(A | B 1 ) 1 P(B 2 )P(A | B 2 ) P(A | B 1 ) A P(B 1 ) P(A | B 1 ) B 1 P(B 1 ) P(Ac | B 1 ) Ac P(B 1 ) P(Ac | B 1 ) P(B 2 ) P(A | B 2 ) A P(B 2 ) P(A | B 2 ) B 2 P(Ac | B 2 ) Ac P(B 2 ) P(Ac | B 2 ) Gráfi ca 1.14 P B E( ) ( . )( . ) ( . )( . ) ( . )( . ) . 2 0 7 0 15 0 3 0 1 0 7 0 15 0 5 1 5 1105 0 137 7 9 0 777 . .5 5 PROBABILIDAD CONJUNTA 27 1. De los estudiantes de una escuela de bachillerato,1/3 son hombres y 2/3 son mujeres. Una encuesta reveló que 1/5 de los hombres y 2/7 de las mujeres elegirán una carrera en la opción de ciencias. Se elige un estudiante al azar y resultó que va a escoger una carrera en la opción de ciencias. ¿Cuál es la probabilidad de que sea mujer? 2. En una fábrica hay dos máquinas A y B. La máquina A hace 40% de la producción, de la cual 2% son artículos defectuosos. La máquina B realiza 60% de la producción, de la cual 1% son artículos defectuosos. Se elige al azar un objeto producido en la fábrica y resulta defectuoso. ¿Cuál es la probabilidad de que provenga de la máquina A? 3. Una urna A contiene 10 bolas numeradas del 1 al 10 y otra caja B contiene 20 bolas numeradas del 1 al 20. Si al lanzar un dado cae una cara con 1 o 2 puntos, se elige la caja A y de ella se saca una bola al azar. Si la cara del dado que sale no es la de 1 o 2 puntos, se elige la caja B y de ella se saca una bola al azar. Al realizar el experimento se obtuvo una bola que es múltiplo de 3. ¿Cuál es la probabilidad de que el dado haya caído con la cara 1 o 2? Evaluación formativa RESUMEN Dada una experiencia aleatoria con espacio muestral Ω y dos eventos A y B, se defi ne un nuevo evento llamado la conjunción de A y B, que se denota con AyB, de la siguiente manera: AyB ocurre siempre que se den A y B; es decir, ambos simultánea- mente. A la probabilidad de AyB, que se simboliza así: P(AyB), se le llama probabili- dad conjunta de A y B. Se dice que dos eventos A y B son mutuamente excluyentes si no pueden ocurrir al mismo tiempo, es decir, si ocurre A no ocurre B y a la inversa, si ocurre B no ocurre A. Esto signifi ca que los eventos no tienen elementos en común, es decir, que AyB 5 Φ. En este caso: P(AxB) 5 P(A) 1 P(B). Si dos eventos A y B no son mutuamente excluyentes, entonces la fórmula de la unión de dos eventos toma la forma: P(AxB) 5 P(A) 1 P(B) 2 P(AyB). Sean A y B dos eventos de una experiencia aleatoria, de modo que P(A) . 0; la probabilidad condicional de B dado que A ocurre, que se simboliza con la expresión P(B | A), se defi ne como: P(B | A) 5 P(AyB) / P(A). Teniendo en cuenta la fórmula anterior, se deduce que: P(AyB) 5 P(A) 3 P(B | A) Se lee “La probabilidad conjunta de A y B es igual a la probabilidad de A por la pro- babilidad condicional de B dado que ocurrió A”. Se dice que dos eventos A y B pertenecientes a Ω son independientes si la ocurren- cia de A no modifi ca la probabilidad de la ocurrencia de B y a la inversa, la ocurrencia de B no modifi ca la probabilidad de la ocurrencia de A. Esto signifi ca que P(B | A) 5 P(B) y P(A | B) = P(A). Más en general, A y B son independientes si P(AyB) 5 P(A) 3 P(B). PROBABILIDAD Y ESTADÍSTICA II 28 ✄ En una experiencia aleatoria con espacio muestral Ω, un par de eventos B 1 y B 2 for- man una partición del espacio muestral si cumplen dos condiciones: a) B 1 y B 2 5 Φ b) B 1 x B 2 5 Ω Dado un evento cualquiera A y una partición B 1 y B 2 , la formula de la probabilidad total es: P(A) 5 P(B 1 ) P(A | B 1 ) 1 P(B 2 ) P(A | B 2 ) El caso más simple de la fórmula de Bayes está dada por: P(B 1 | A) 5 P(B 1 ) P(A | B 1 ) / [P(B 1 ) P(A | B 1 ) 1 P(B 2 ) P(A | B 2 )] PROBABILIDAD CONJUNTA 29 E V A L U A C I Ó N S U M A T I V A 29 1. Se lanza un dado. Considera los eventos A 5 {1, 2} y B 5 {5, 6} y contesta: a ) Los eventos A y B son mutuamente excluyentes. b ) Los eventos A y B son independientes. Argumenta tu respuesta. 2. Se lanza un dado. Defi ne el evento C: “Un número par”, y el evento D: “Un número múltiplo de 3”. Es decir, C 5 {2, 4, 6} y D 5 {3, 6}. Responde: a ) Los eventos A y B son mutuamente excluyentes. b ) Los eventos A y B son independientes. Argumenta tu respuesta. 3. Se lanzan tres monedas bien equilibradas. Para calcular la probabilidad de que salgan todas águilas, tres estudiantes razonan así: Juan: La probabilidad de obtener águila en una primera moneda es 1/2, la probabilidad de obtener águila en una segunda moneda es 1/2 y la de obtener águila en la tercera es 1/2; luego la probabilidad es (1/2) (1/2) (1/2) 5 1/8. Pedro: La probabilidad de obtener águila en una primera moneda es 1/2; la probabilidad de obtener águila en una segunda moneda es 1/2 y la de obtener águila en la tercera es 1/2, luego la probabilidad es 1/2. Pablo: Hay ocho arreglos en los que pueden caer las tres monedas: AAA, AAS, ASA, SAA, ASS, SAS, SSA, SSS. De ellos sólo uno es favorable a “salgan todas águilas”, de donde la probabilidad es 1/8. ¿Qué razonamiento(s) es(son) correcto(s) y por qué? 4. Sean A y B eventos tales que: P (A) 5 1/3, P (B) 5 1/4, P (A x B) 5 1/2. Calcula P (A | B) y P (B | A). 5. En una urna hay nueve bolas numeradas del 1 al 9. Se saca una bola y se observa que es impar, ¿Cuál es la probabilidad de que sea múltiplo de 3? 6. En una población 30% de las mujeres y 60% de los hombres votarán por el candidato A. mientras que 70% de las mujeres y 40% de los hombres votaran por el candidato B. En esa población hay 55% de hombres y 45% de mujeres, de los cuales se elige una persona al azar. a) ¿Cuál es la probabilidad de que esa persona vote por el candidato A? b) Si la persona votara por el candidato A, ¿cuál es la probabilidad de que sea mujer? PROBABILIDAD Y ESTADÍSTICA II 30 31 G l o s a r i o B I B L I O G R A F Í A HOEL, Paul. Estadística elemental, Compañía Editorial Continental, México, 1976. LIPSCHUTZ, Seymour y Lipson, Marc. Probabilidad [Serie Schaum], McGraw-Hill, México, 2001. Identifi ca los siguientes términos en el texto de la unidad y escribe su signifi cado. Eventos dependientes. Eventos independientes. Eventos mutuamente excluyentes. Probabilidad conjunta. Teorema de Bayes. A M P L I A N D O E L C O N O C I M I E N T O Tema 1 2.1 DISTRIBUCIÓN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA DISCRETA Tema 2 2.2 DISTRIBUCIÓN DE PROBABILIDAD BINOMINAL Objetivo El estudiante resolverá problemas de probabilidad con base en el concepto de distribución de pro- babilidad de variables aleatorias discretas. Aprenderá a distin- guir cuándo en una situación se presenta una variable aleatoria y cómo obtener su distribución en casos sencillos. Identifi cará variables que siguen un mo- delo binominal y será capaz de calcular su medida y desviación estándar y apoyarse en tablas para encontrar valores específi cos y evitar cálculos. Se fomentará el trabajo colaborativo y una actitud positiva hacia la materia y sus compañeros. Distribución de probabilidad de variables Contenido aleatorias discretas Unidad 2 tus conocimientos En contacto con • ¿Qué entiendes por variable? • ¿Qué signifi ca para ti una variable aleatoria? • ¿Qué entiendes por distribución de probabilidad? • ¿Qué entiendes por distribución de probabilidad binomial? • ¿Cuál sería el valor de la probabilidad si sumamos las probabilidades de todos los posibles valores de una variable aleatoria discreta? • ¿Qué es el valor esperado de una variable aleatoria? • Imagina una experiencia aleatoria e identifi ca una variable en el espacio muestral de dicho experimento. Describe todos los posibles valores que puede tomar la variable aleatoria. • Identifi ca algunas experiencias aleatorias donde sólo pueden suceder dos casos posibles. • Si lanzas una moneda al aire 10 veces, ¿qué es más probable que ocurra? a) 5 águilas y 5 soles. b) 3 águilas y 7 soles. c) 4 águilas y 6 soles. • Una máquina expendedora de goma de mascar contiene chicles en forma cónica (esfera), entre los 40% son rojos, 30% verdes y 30% azules. Si se obtienen 20 chicles mediante el mecanismo aleatorio de la máquina, ¿cuántos chicles rojos esperas tener en total? a) 8 rojos b) 4 rojos c) No tengo la menor idea de la cantidad de chicles rojos que puedan salir. Es una verdad cierta que, cuando no está en nuestra mano determinar lo que es verdad, debemos seguir lo que es más probable. René DescartesPROBABILIDAD Y ESTADÍSTICA II 34 INTRODUCCIÓN Las distribuciones de probabilidad constituyen un tema en el que confl uyen tanto conceptos de estadística como de probabilidad. De hecho, son un puente que conecta estas dos importantes áreas, y son la puerta de entrada a la inferencia estadística. En estadística se estudian distribuciones de datos, que se descri- ben mediante medidas de tendencia central y variabilidad. Sin embargo, en las aplicaciones más frecuentes de la esta- dística los datos son tomados de muestras de una población o de experimentos aleatorizados, por lo que están sujetos a incertidumbre. Se requiere, por lo tanto, establecer medidas probabilísticas de confi abilidad para hacer generalizaciones y obtener conclusiones válidas. Las distribuciones de proba- bilidad desempeñan un papel muy importante para lo ante- rior, ya que permiten conocer todos los valores posibles de una variable aleatoria y sus respectivas probabilidades. Anteriormente habíamos estudiado la probabilidad de eventos aislados o com- puestos, defi nidos en un espacio muestral asociado a un experimento aleatorio. Las distribuciones de probabilidad constituyen otro importante aspecto del estudio de la probabilidad, ya que nos interesan todos los posibles eventos que se presentan en un fenómeno aleatorio y sus respectivas probabilidades en forma de distribución. Con frecuencia el estudio de la probabilidad se ve como un aspecto separado de la estadística, sin embargo, en esta unidad veremos que existen importantes conexiones entre diversas situaciones cotidianas con la probabilidad y la estadística. Abordaremos situaciones que provienen de un contexto estadístico y les daremos una interpretación tomando en cuenta conceptos de probabilidad, tal es el caso de las frecuencias relati- vas de valores o intervalos de valores de una variable estadística, que a partir de ciertas condiciones puede considerarse como una variable aleatoria. 2.1 DISTRIBUCIÓN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA DISCRETA La distribución de los datos que provienen de una varia- ble estadística nos permite identifi car qué valores toma y con qué frecuencia se presenta cada valor. Los datos también pueden derivarse de la observación de un fe- nómeno o experimento aleatorio. En este caso particu- lar, la variable recibe el nombre de variable aleatoria, y la distribución de datos se conoce como distribución de probabilidad. DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES ALEATORIAS DISCRETAS 35 2.1.1 Variable aleatoria discreta Una variable aleatoria es aquella cuyos valores provienen de la observación de un fenóme- no o experimento aleatorio. Generalmente, las variables aleatorias se representan con las últimas letras mayúsculas del alfabeto (X, Y, Z), y sus posibles valores se repre- sentan con minúsculas (x, y, z). Ejemplo Consideremos el experimento aleatorio en el que se lanza una moneda un par de veces, y en el cual nos interesa la variable aleatoria “número de águilas” que pueden caer. El espacio muestral del experimento está dado por AA, AS, SA, SS, por lo que la variable aleatoria X 5 “número de águilas”, puede tomar los siguientes valores: X 5 0, cuando el resultado es SS X 5 1, cuando el resultado es AS o SA X 5 2, cuando el resultado es AA Obsérvese que los eventos del espacio muestral se transfor- maron a valores numéricos (0, 1, 2) al defi nir una variable aleatoria. Otros ejemplos de variables aleatorias son los siguientes: • Cantidad de artículos defectuosos en un lote que se exa- mina para control de calidad. • Cantidad de usuarios en un sitio de internet durante de- terminado día. • Nivel de azúcar en la sangre en una muestra de pacientes diabéticos. • Califi caciones de estudiantes de preparatoria que presen- taron su examen para ingresar a licenciatura. • Cantidad de puntos con los que cierra la Bolsa Mexicana de Valores cada día de operaciones. • Número de goles que anota un equipo de futbol en un par- tido de la temporada. Como puede verse, todas las variables están asociadas a fenómenos en los que no se puede predecir el resultado, por eso se les denomina aleatorias. No obstante, como veremos después, es factible determinar sus posibles valores y sus frecuencias o probabilidades de ocurrencia, conforme se observan en forma repetida un gran número de veces o cuando se dispone de un espacio muestral bien defi nido. PROBABILIDAD Y ESTADÍSTICA II 36 Las variables aleatorias pueden ser discretas o continuas: a) Una variable aleatoria discreta puede tomar un número fi nito o infi nito con- table de valores. Por lo general estas variables se asocian a procesos de contar, por lo que pueden tomar valores como 0, 1, 2, 3, . . . Por ejemplo: el número de hijos por familia, la cantidad de bacterias por unidad de área en un alimento, los años de vida de un ser humano, etcétera. b) Una variable aleatoria continua puede tomar cualquier valor entre un interva- lo dado, por tal motivo es común que se expresen mediante rangos de valores. Por lo común estas variables se asocian a procesos de medir. Por ejemplo: la temperatura de una ciudad durante el día, el peso de una muestra de personas sujetas a un tratamiento dietético, la califi cación de un examen. En esta unidad abordaremos sólo las variables aleatorias discretas y sus distribu- ciones de probabilidad, y en la siguiente las variables aleatorias continuas. Como las variables aleatorias están asociadas a un fenómeno o experimento alea- torio, es factible determinar las frecuencias o probabilidades con las que ocurre cada posible resultado, lo cual da lugar a una distribución de probabilidad. 2.1.2 Representación de una distribución de probabilidad Una distribución de probabilidad se puede representar a través de una tabla, una gráfi ca o una fórmula. Por ejemplo, para el caso del lanzamiento de dos monedas en forma simultánea antes mencionado, y en el cual X representa el número de águilas, se tienen las si- guientes probabilidades: P(X 5 0) 5 1/4 P(X 5 1) 5 2/4 P(X 5 2) 5 1/4 Expresados en forma tabular, tanto los valores de la variable como sus respectivas probabilida- des, se tiene la siguiente distribución de proba- bilidad: X 0 1 2 P(X) 0.25 0.50 0.25 Los resultados anteriores también pueden ser expresados en forma (gráfi ca 2.1). 0.1 0 1 2 3 0.2 0.3 0.4 P(X) Número de águilas 0.5 Gráfi ca 2.1 DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES ALEATORIAS DISCRETAS 37 El ejemplo anterior corresponde a una variable aleatoria discreta. Las distribucio- nes que se generan con este tipo de variables se denominan distribuciones discre- tas de probabilidad. Una distribución de probabilidad de una variable discreta debe satisfacer las si- guientes condiciones: 1. Para cada valor de la variable, la probabilidad cae entre 0 y 1. 2. La suma de las probabilidades para todos los valores de la variable es igual a 1. Ejemplo Consideremos ahora un caso muy común cuando hablamos de probabilidad. Se trata de un dado de 6 caras que es lanzado al aire. Sea X 5 “el número de puntos de la cara que cae hacia arriba”. Sabemos que la variable aleatoria X puede tomar los valores 1, 2, 3, 4, 5, 6, con probabilidad p x( ) 5 1 6 para cada valor. Una tabla y una gráfi ca de la distribución anterior se muestran a continuación: x 1 2 3 4 5 6 P(x) 1/6 1/6 1/6 1/6 1/6 1/6 Un caso similar al anterior, pero con sólo dos barras con pro- babilidad P x( ) 5 1 2 , se presenta cuando se lanza una moneda equilibrada al aire. Este tipo de distribuciones se denominan distribuciones discretas uniformes. P(X) 0.20 0.15 0.10 0.05 1 2 3 4 X 5 6 Gráfi ca 2.2 PROBABILIDAD Y ESTADÍSTICA II 38 Ejemplo Una pareja que acaba de contraer matrimonio desea saber sus probabilidades de tener tres hijos, entre los cuales exista al menos un hombre. Para simplifi car el problema consideremos igualmente probable que esta pareja tenga tanto un hijo de sexo femenino como uno del sexo masculino. Elespacio muestral de este fenómeno aleatorio está conformado de la siguiente manera: HHH, HHM, HMH, HMM, MMM, MHM, MHH, MMH. Defi namos por X la variable aleatoria “número de hombres a tener en una fa- milia de tres hijos”, por lo que X 5 1 cuando el resultado es un hombre en la familia de tres hijos. Entonces, los posibles valores de X serán 0, 1, 2 y 3. Sin embargo, según los eventos del espacio muestral no todos tienen la misma pro- babilidad de ocurrir: Tabla 2.1 Valores de la variable X Eventos Probabilidad P(X) 0 MMM 1/8 5 0.125 1 HMM, MHM, MMH 3/8 5 0.375 2 HHM, HMH, MHH, 3/8 5 0.375 3 HHH 1/8 5 0.125 Suma 1.000 Una gráfi ca de la distribución de probabilidad, también conocida como histogra- ma de probabilidad, se muestra a continuación: 0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 2 1 0 1 2 3 4 P(X) Área 5 1 Número de hombres Gráfi ca 2.3 DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES ALEATORIAS DISCRETAS 39 Obsérvese que tanto la representación tabular como la gráfi ca nos muestran todos los posibles valores de la variable X 5 “número de hombres a tener en una familia de tres hijos”, así como sus respectivas probabilidades. En un histograma de probabilidad, las alturas de los rectángulos o barras son proporcionales a las probabilidades respectivas; por tanto, si se toman las bases con un ancho unitario se tiene que el área del histograma es igual a 1, sin duda una impor- tante propiedad de las distribuciones de probabilidad. Un hecho que conviene resaltar es que cuando se sabe la distribución de probabilidad de una variable aleatoria, se conocen todos sus posibles valores y sus respectivas pro- babilidades; en otras palabras, con ello se conoce por com- pleto el comportamiento probabilístico del fenómeno. Analicemos un hecho más en el contexto de este mismo ejemplo. Supongamos que estudiamos una gran canti- dad de familias que tuvieron tres hijos y anotamos en cada caso el número de hijos de sexo masculino. Si la distribución de probabilidad que obtuvimos representa adecuadamente la situación antes descrita, la distribu- ción de frecuencias con los resultados de la observación debe ser muy similar a la que obtuvimos a través de los cálculos. También podemos utilizar un programa estadístico o una hoja de cálculo para simular la situación anterior. En este caso utilizamos esta última opción. 0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0 1 Número de hombres Distribución teórica Distribución empírica 2 3 P(X) X Gráfi ca 2.4 La gráfi ca continua representa la distribución teórica o exacta de probabilidades, y el histograma, la distribución empírica obtenida del recuento de 1 000 observa- ciones simuladas en un software estadístico. A medida que se incremente el número de observaciones, la distribución empírica se acercará cada vez más a la distribución teórica. PROBABILIDAD Y ESTADÍSTICA II 40 La siguiente gráfi ca muestra lo anterior para una simulación de 5 000 casos. 0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 021 1 Número de hombres 2 3 4 P(X) Gráfi ca 2.5 En los dos ejemplos anteriores se abordaron situaciones en las que la variable alea- toria fue defi nida sobre un espacio muestral de un experimento aleatorio. Sin em- bargo, existe una diversidad de fenómenos aleatorios en los que es imposible defi nir con facilidad el espacio muestral. En tales casos se obtienen distribuciones empíricas de probabilidad, que a medida que se construyen sobre un gran número de observa- ciones suelen ser bastante precisas. Veamos a continuación algunos de ellos. Ejemplo De acuerdo con cifras del II Conteo de Población y Vivienda 2005, realizado en México por el INEGI, se tiene la siguiente distribución de edades para los mexi- canos: Tabla 2.2 Distribución por edad para los mexicanos en 2005. Edad (años) Porcentaje Frecuencia relativa 0-14 31.5 0.315 15-59 60.2 0.602 60 y más 8.3 0.083 Suma 100 1 Fuente: http://www.inegi.gob.mx/prod_serv/contenidos/espanol/bvinegi/productos/censos/ conteo/2005. La anterior es una tabla estadística con datos sobre la distribución de edades de los mexicanos al año 2005. Consideremos una situación aleatoria el hecho de preguntar DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES ALEATORIAS DISCRETAS 41 a cada mexicano su edad. Algo similar a extraer persona por persona de una urna gigantesca donde se encuentran los nombres de todos los mexicanos y preguntar su edad. La variable edad se ha dividido en tres categorías lo que la convierte en una varia- ble discreta y sus frecuencias relativas pueden ser consideradas como probabilida- des. De esta manera, al seleccionar al azar un mexicano de un listado completo, el resultado más probable será una persona con una edad entre 15 y 59 años inclusi- ve. Una representación gráfi ca de la distribución se muestra a continuación: 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0-14 15-59 Edad P(X) X 60 o más Gráfi ca 2.6 Ejemplo Aquí se trata de una distribución de frecuencias con las edades de los conductores que participan en accidentes en nuestro país. Los datos fueron tomados de miles de expedientes y son de utilidad para las compañías de seguros. PROBABILIDAD Y ESTADÍSTICA II 42 Por tipo de sexo En lo que corresponde al sexo de los involucrados Porcentaje de los accidentados 1.08% 1 a 5 5 a 10 11 a 15 16 a 20 21 a 25 26 a 30 31 a 35 36 a 40 41 a 45 46 a 50 51 a 55 56 a 60 61 a 65 66 a 70 71 a 75 76 a 80 81 a 85 86 a 90 91 a 95 96 a 100 1.70% 2.8% 10.2% 17.5% 18.0% 16.4% 12.6% 9.1% 6.7% 4.7% 3.0% 1.09%1.01% 0.9% 0.5% 0.3% 0.1% 0.05% 0.02% Durante 2006 los siniestros automovilísticos fueron la principal causa de muerte en México 1.93% volcaduras 6.1% se ignora 23.40% mujeres 19.44% atropellados 79.99% choques 70.59% hombres 1.64% caída de los pasajeros en transporte público En 2005 se registraron 21 mil 718 accidentes de tránsito Por edad Por tipo de accidente Radiografía de los accidentes Fuente: Periódico Noroeste de Culiacán (31/01/2007). www.noroeste.com.mx Gráfi ca 2.7 Este caso representa la manera en que una distribución de frecuencias obtenidas de la observación de un fenómeno puede ser interpretada como una distribución de probabilidad empírica. Las edades a las que es más probable tener un accidente osci- lan entre 21 y 35 años de edad. Ejemplo En este caso se trata de los goles que dos equipos del futbol mexicano: Club América y Cruz Azul obtuvieron en cada partido del torneo de apertura 2007 y clausura 2008. DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES ALEATORIAS DISCRETAS 43 Tabla 2.3 Fecha América2007-2008 Cruz Azul 2007-2008 Fecha América 2007-2008 Cruz Azul 2007-2008 1 0 0 0 1 10 2 2 2 2 2 6 1 1 0 11 1 0 2 2 3 1 2 1 4 12 0 0 1 2 4 4 2 3 0 13 2 1 1 2 5 1 0 3 1 14 2 2 2 2 6 2 0 4 1 15 1 0 1 2 7 0 0 1 4 16 1 0 1 1 8 1 0 0 0 17 1 1 2 0 9 1 1 2 3 Nombremos X a la variable aleatoria que representa el número de goles en cada partido. Se considerarán los 34 partidos realizados en ambos torneos (17 en cada uno). Un concentrado de los valores de X para cada equipo nos proporciona la distribución de frecuencias y probabilidades para los posibles valores de la varia- ble aleatoria: Tabla 2.4 X = Número de goles América Cruz Azul 0 12 0.35 6 0.18 1 12 0.35 11 0.32 2 8 0.24 11 0.32 3 0 0 3 0.09 4 1 0.03 3 0.09 5 0 0 0 0 6 1 0.03 0 0 Total 34 1.00 34 1.00 Una gráfi ca con la distribución de probabilidad de X para ambos equipos se mues- tra a continuación: PROBABILIDAD Y ESTADÍSTICA II 44 Ejemplo En el contexto del problema anterior consideremos las probabilidades acumula- das para el equipo Cruz Azul (tabla 2.5). Tabla 2.5 Número de goles Frecuencia Probabilidad P(X 5 x) Probabilidad acumulada P(X # x) 0 6 0.18 0.18 1 11 0.32 0.50 2 11 0.32 0.82 3 3 0.09 0.91 4 3 0.09 1.00 Total 34 1.00 ¿Cuál es
Compartir