Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
BIOESTADÍSTICA – SEMANA 8 MEDIDAS DE DISPERSIÓN BIOESTADÍSTICA - SEMANA 8 MEDIDAS DE DISPERSIÓN A) GENERALIDADES Y LA VARIANZA, LA DESVIACIÓN RANGO INTERCUARTÍLICO COEFICIENTE DE VARIACIÓN ESTANDAR Y LA DESVIACIÓN MEDIA Z 1 Medidas de Dispersión Las medidas de tendencia central ofrecen una idea aproximada del comportamiento de una serie estadística. Pero, no resultan suficientes para expresar sus características: una misma medida puede provenir de valores cercanos a la misma o resultar de la confluencia de datos estadísticos enormemente dispares. Para conocer en que grado las medidas de tendencia central son representativas de la serie, se han de complementar con medidas de dispersión o también llamadas de variabilidad absoluta, Las medidas dispersión, amplían el concepto de variabilidad, como el método de las medidas de Endoncia central, que describen el comportamiento de los datos en una distribución de frecuencia. Las informaciones que proporcionan estas medidas son limitadas y no dicen nada sobre cómo están distribuidos o dispersos los datos con relación a la tendencia central. Poco indican sobre un determinado dato con relación a otros de la distribución. Las medidas de dispersión o variabilidad son aquellas que miden la dispersión de los datos, es decir, nos dicen qué tan parecidos o que tan diferentes son entre si los valores observados. ] Medidas de Dispersión La interpretación de un grupo de datos individuales necesita de informaciones que permitan apreciar la dispersión de los valores alrededor de la medida de tendencia central. Estas medidas son importantes por sus propiedades algebraicas, por lo que es frecuente su implementación en la solución de problemas de estadística aplicada. Así, las medidas de dispersión pueden definirse como los valores numéricos cuyo objeto es analizar el grado de separación de los valores de una serie estadística con respecto a las medidas de tendencia central consideradas. BIOESTADÍSTICA - SEMANA 8 MEDIDAS DE DISPERSIÓN A) GENERALIDADES Y LA VARIANZA, LA DESVIACIÓN RANGO INTERCUARTÍLICO COEFICIENTE DE VARIACIÓN ESTANDAR Y LA DESVIACIÓN MEDIA Z 1 Medidas de Dispersión Las medidas de tendencia central ofrecen una idea aproximada del comportamiento de una serie estadística. Pero, no resultan suficientes para expresar sus características: una misma medida puede provenir de valores cercanos a la misma o resultar de la confluencia de datos estadísticos enormemente dispares. Para conocer en que grado las medidas de tendencia central son representativas de la serie, se han de complementar con medidas de dispersión o también llamadas de variabilidad absoluta, Las medidas dispersión, amplían el concepto de variabilidad, como el método de las medidas de Endoncia central, que describen el comportamiento de los datos en una distribución de frecuencia. Las informaciones que proporcionan estas medidas son limitadas y no dicen nada sobre cómo están distribuidos o dispersos los datos con relación a la tendencia central. Poco indican sobre un determinado dato con relación a otros de la distribución. Las medidas de dispersión o variabilidad son aquellas que miden la dispersión de los datos, es decir, nos dicen qué tan parecidos o que tan diferentes son entre si los valores observados. ] Medidas de Dispersión La interpretación de un grupo de datos individuales necesita de informaciones que permitan apreciar la dispersión de los valores alrededor de la medida de tendencia central. Estas medidas son importantes por sus propiedades algebraicas, por lo que es frecuente su implementación en la solución de problemas de estadística aplicada. Así, las medidas de dispersión pueden definirse como los valores numéricos cuyo objeto es analizar el grado de separación de los valores de una serie estadística con respecto a las medidas de tendencia central consideradas. 4 Las medidas de dispersión son de dos tipos: + Medidas de dispersión absoluta: como recorrido, desviación media, varianza y desviación típica, que se usan en los análisis estadísticos generales. * Medidas de dispersión relativa: que determinan la dispersión de la distribución estadística independientemente de las unidades en que se exprese la variable. Se trata de parámetros más técnicos y utilizados en estudios específicos, y entre ellas se encuentran los coeficientes de apertura, el recorrido relativo, el coeficiente de variación (índice de dispersión de Pearson) y el índice de dispersión mediana. 21 MEDIDAS DE DISPERSIÓN + Describen la cantidad de dispersión o variabilidad que se encuentra entre los datos. Datos bastante agrupados poseen valores relativamente pequeños; dato más dispersos tienen valores más grandes. El agrupamiento más extenso ocurre cuando los datos carecen de dispersión. * Desviación estándar: (0) mide cuánto se separan los datos. Es la raíz cuadrada de la varianza. * Varianza: media aritmética de los cuadrados de las diferencias (desviaciones) entre los valores que toma la variable y su media aritmética. Su símbolo es S? en la muestra y o? en la población. >» Nix, -xy S > n | Resumen de Varianza * En otras palabras, sigue estos pasos: Calcula la media (el promedio de los números) 2. Por cada número resta la media y eleva el resultado al cuadrado (la diferencia elevada al cuadrado). 3. Calcula la media de esas diferencias al cuadrado. 4 Las medidas de dispersión son de dos tipos: + Medidas de dispersión absoluta: como recorrido, desviación media, varianza y desviación típica, que se usan en los análisis estadísticos generales. * Medidas de dispersión relativa: que determinan la dispersión de la distribución estadística independientemente de las unidades en que se exprese la variable. Se trata de parámetros más técnicos y utilizados en estudios específicos, y entre ellas se encuentran los coeficientes de apertura, el recorrido relativo, el coeficiente de variación (índice de dispersión de Pearson) y el índice de dispersión mediana. 21 MEDIDAS DE DISPERSIÓN + Describen la cantidad de dispersión o variabilidad que se encuentra entre los datos. Datos bastante agrupados poseen valores relativamente pequeños; dato más dispersos tienen valores más grandes. El agrupamiento más extenso ocurre cuando los datos carecen de dispersión. * Desviación estándar: (0) mide cuánto se separan los datos. Es la raíz cuadrada de la varianza. * Varianza: media aritmética de los cuadrados de las diferencias (desviaciones) entre los valores que toma la variable y su media aritmética. Su símbolo es S? en la muestra y o? en la población. >» Nix, -xy S > n | Resumen de Varianza * En otras palabras, sigue estos pasos: Calcula la media (el promedio de los números) 2. Por cada número resta la media y eleva el resultado al cuadrado (la diferencia elevada al cuadrado). 3. Calcula la media de esas diferencias al cuadrado. "1 Ejemplo de Varianza * Las alturas de los hombros de los siguientes perros son: 600mm, 470mm, 170mm, 430mm y 300omm. 600 400 200 0 Q Media * Media: 600+470+170+430+300/5=1970/5=3094 * Diferencia de cada altura con la media: 600 400 200 0 2] Varianza + Para calcular la varianza, toma cada diferencia, elévala al cuadrado, y haz la media: 206? + 76? + (-224)? + 36? + (-94)* 108,520 Varianza: 0? = = = 21,704 "1 Ejemplo de Varianza * Las alturas de los hombros de los siguientes perros son: 600mm, 470mm, 170mm, 430mm y 300omm. 600 400 200 0 Q Media * Media: 600+470+170+430+300/5=1970/5=3094 * Diferencia de cada altura con la media: 600 400 200 0 2] Varianza + Para calcular la varianza, toma cada diferencia, elévala al cuadrado, y haz la media: 206? + 76? + (-224)? + 36? + (-94)* 108,520 Varianza: 0? = = = 21,704 J Ejemplo de Desviación estándar + Es la raíz cuadrada de la varianza. o = 421,704= 147 * Veremos qué alturas están a distancia menos de la desviación estándar (147 mm) de la media. * Usando la desviación estándar tenemos una manera "estándar" de saber qué es normal, o extra grande o extra pequeño. FL] Desviación Media * En toda distribución la suma de las desviaciones de cada valor de la variable respecto a la media es cero. Significa que la sunt "de las desviaciones de las variables mayores que la media es igual y de signo contrario a la suma de las desviaciones de las variables menores que la media, razón por la que emplea los valores absolutos de las desviaciones para obtener la desviación media. * Para calcular la varianza media es necesario prescindir de los signos negativos y tomar los valores absolutos de las desviaciones respecto a la media aritmética. Si elevamos al cuadrado las desviaciones, logramos que todos los resultados positivos, sumando los cuadrados de las desviaciones y dividiendo por N, resulte el estadístico llamado varianza, base para calcular la desviación estándar. Z 1 Desviación Media * Las medidas de variabilidad absoluta o de dispersión analizan un grupo de datos de manera más rigurosa y profunda, para extraer información sobre qué tan dispersos resultan los datos alrededor de la media y así verificar su comportamiento + Esta medida de dispersión es considerada como una de las medidas más fácil de calcular, por lo que es utilizada en la mayoría de los casos, con el único fin de agilizar las operaciones, de ahí que el resultado se le considere como una aproximación a la cuantificación de la dispersión. J Ejemplo de Desviación estándar + Es la raíz cuadrada de la varianza. o = 421,704 = 147 * Veremos qué alturas están a distancia menos de la desviación estándar (147 mm) de la media. * Usando la desviación estándar tenemos una manera "estándar" de saber qué es normal, o extra grande o extra pequeño. FL] Desviación Media * En toda distribución la suma de las desviaciones de cada valor de la variable respecto a la media es cero. Significa que la sunt "de las desviaciones de las variables mayores que la media es igual y de signo contrario a la suma de las desviaciones de las variables menores que la media, razón por la que emplea los valores absolutos de las desviaciones para obtener la desviación media. * Para calcular la varianza media es necesario prescindir de los signos negativos y tomar los valores absolutos de las desviaciones respecto a la media aritmética. Si elevamos al cuadrado las desviaciones, logramos que todos los resultados positivos, sumando los cuadrados de las desviaciones y dividiendo por N, resulte el estadístico llamado varianza, base para calcular la desviación estándar. Z 1 Desviación Media * Las medidas de variabilidad absoluta o de dispersión analizan un grupo de datos de manera más rigurosa y profunda, para extraer información sobre qué tan dispersos resultan los datos alrededor de la media y así verificar su comportamiento + Esta medida de dispersión es considerada como una de las medidas más fácil de calcular, por lo que es utilizada en la mayoría de los casos, con el único fin de agilizar las operaciones, de ahí que el resultado se le considere como una aproximación a la cuantificación de la dispersión. F) Desviación media de una muestra + La desviación media (representada por DM) de una muestra que contiene n observaciones x,, X ,, X,, se escribe de la siguiente manera: bey 3|+|0,5]+)x,3] +K+|x,-3| dm= n n n Y hr Y ll, i-1 i-1 Datos no agrupados: DM= —————— Datos agrupados: DM= n n + Donde: + X : media aritmética de la muestra + Xi: ivalor de la variable aleatoria x + n:tamaño de la muestra + Alrealizar la suma de los resultados de las diferencias entre cada observación y la media, sin el valor absoluto la respuesta sería, siempre igual a cero. Observe que la desviación media (además de incluir todos los datos) tiene en cuenta una medida de posición, que puede ser la media o la mediana. + Si se calcula tomando la media aritmética de los valores absolutos de las diferencias entre cada uno de los datos del conjunto y la mediana, se llamará desviación mediana, usada para distribuciones que tienen valores extremos (muy alejados del centro) o que contienen intervalos abiertos. 5 1 57 10,5 =-5,5 59 8 2 8 - 10,5 = -2,5 2,5 11 3 11 - 10,5 = 0,5 0,5 14 1 14 - 10,5 = 3,5 3,5 16 1 16 - 10,5 = 5,5 5,5 8 17,5 = 2,19 —J Recorrido * La medida de dispersión más inmediata es el recorrido de la distribución estadística, también llamado rango o amplitud, ue es la diferencia entre los valores extremos de los intervalos ( mayor y el menor de todos); rango en el que están istribuidos los demás valores del conjunto, dada una serie de valores X1, X2, ..., Xn, su recorrido es la diferencia aritmética entre el máximo y el mínimo de estos valores: Re = x, (máx) — x, (mín), siendoi= 1,2,....n. F) Desviación media de una muestra + La desviación media (representada por DM) de una muestra que contiene n observaciones x,, X ,, X,, se escribe de la siguiente manera: bey 3|+|0,5]+)x,3] +K+|x,-3| dm= n n n Y hr Y ll, i-1 i-1 Datos no agrupados: DM= —————— Datos agrupados: DM= n n + Donde: + X : media aritmética de la muestra + Xi: ivalor de la variable aleatoria x + n:tamaño de la muestra + Alrealizar la suma de los resultados de las diferencias entre cada observación y la media, sin el valor absoluto la respuesta sería, siempre igual a cero. Observe que la desviación media (además de incluir todos los datos) tiene en cuenta una medida de posición, que puede ser la media o la mediana. + Si se calcula tomando la media aritmética de los valores absolutos de las diferencias entre cada uno de los datos del conjunto y la mediana, se llamará desviación mediana, usada para distribuciones que tienen valores extremos (muy alejados del centro) o que contienen intervalos abiertos. 5 1 57 10,5 =-5,5 59 8 2 8 - 10,5 = -2,5 2,5 11 3 11 - 10,5 = 0,5 0,5 14 1 14 - 10,5 = 3,5 3,5 16 1 16 - 10,5 = 5,5 5,5 8 17,5 = 2,19 —J Recorrido * La medida de dispersión más inmediata es el recorrido de la distribución estadística, también llamado rango o amplitud, ue es la diferencia entre los valores extremos de los intervalos ( mayor y el menor de todos); rango en el que están istribuidos los demás valores del conjunto, dada una serie de valores X1, X2, ..., Xn, su recorrido es la diferencia aritmética entre el máximo y el mínimo de estos valores: Re = x, (máx) — x, (mín), siendoi= 1,2,....n. MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS 3 Intervalos de clase * No hay formas definidas respecto al número de clases a utilizar en una distribución de frecuencias. Para escoger bien priman la experiencia y la intuición. Si son pocos, se pierden detalles; si son demasiados, el trabajo se torna dispendioso, mostrando irregularidades, no un patrón de comportamiento. Es recomendable no formar menos de cinco y no más de 18 intervalos de clase. La anchura de un intervalo de clase es el número de elementos que lo forman, debe ser igual, pero no es camisa de fuerza. En caso de no establecer esta igualdad, es posible usar diferentes anchuras. + Número de intervalos de clase: subconjuntos de medidas o datos. Tienen un límite inferior (dato menor) y un límite superior (dato mayor). MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS L43 AR TN MEDIDAS DE Fu Varianza Desviación Media Número de DISPERSION Y estándar elementos las para 1 Df Drhl ys Fórmulas para la si ¡=1 /(%i —Hl ix f Ñ varianza y desviación Porción Já E qe Ja? LN EE e 2 estándar de datos i=1 agrupados 1 ! Muestra | ¿2 Diz fix -1) s= 5 Dir % fi pa Y n-1 n 23 MEDIDAS DE DISPERSIÓN Donde: » k: número de clases. * f: frecuencia absoluta de cada clase, es decir, el número de elementos que pertenecen a dicha clase. * x,: marcade clase. Es el punto medio del límite inferior y del límite superior. + (?: varianza de la población. + 9d: desviación estándar de la población. * 1: media de la población. * s2: varianza de la muestra. + s: desviación estándar de la muestra. * Xx: media de la muestra Tenemos siempre que fijarnos si estamos trabajando con datos que forman una población o con datos que forman una muestra, pues las fórmulas son diferentes. 3 Intervalos de clase * No hay formas definidas respecto al número de clases a utilizar en una distribución de frecuencias. Para escoger bien priman la experiencia y la intuición. Si son pocos, se pierden detalles; si son demasiados, el trabajo se torna dispendioso, mostrando irregularidades, no un patrón de comportamiento. Es recomendable no formar menos de cinco y no más de 18 intervalos de clase. La anchura de un intervalo de clase es el número de elementos que lo forman, debe ser igual, pero no es camisa de fuerza. En caso de no establecer esta igualdad, es posible usar diferentes anchuras. + Número de intervalos de clase: subconjuntos de medidas o datos. Tienen un límite inferior (dato menor) y un límite superior (dato mayor). MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS L43 AR TN MEDIDAS DE Fu Varianza Desviación Media Número de DISPERSION Y estándar elementos las para 1 Df Drhl ys Fórmulas para la si ¡=1 /(%i —Hl ix f Ñ varianza y desviación Porción Já E qe Ja? LN EE e 2 estándar de datos i=1 agrupados 1 ! Muestra | ¿2 Diz fix -1) s= 5 Dir % fi pa Y n-1 n 23 MEDIDAS DE DISPERSIÓN Donde: » k: número de clases. * f: frecuencia absoluta de cada clase, es decir, el número de elementos que pertenecen a dicha clase. * x,: marca de clase. Es el punto medio del límite inferior y del límite superior. + (?: varianza de la población. + 9d: desviación estándar de la población. * 1: media de la población. * s2: varianza de la muestra. + s: desviación estándar de la muestra. * Xx: media de la muestra Tenemos siempre que fijarnos si estamos trabajando con datos que forman una población o con datos que forman una muestra, pues las fórmulas son diferentes. “1 Desviación media para datos agrupados * Silos datos vienen agrupados en una tabla de frecuencias, la expresión de la desviación media es: Ll [11 SE af; E [Ta 5 | $2 O En == z| fn A N Ad Zi — Tlf; D; il A f 1 Desviación Media para datos agrupados Donde: * fi: frecuencia absoluta de cada valor, es decir, el número de veces que aparece el valor en el estudio. * xi: marca de clase. Es el punto medio del límite inferior y el límite superior de cada intervalo. * k: número de clases. * D. M.: desviación media. * X: media aritmética de los datos. 4) Ejemplo para datos agrupados Edad Frecuencia * Calcular la varianza y la (años) f: desviación estándar de una [O - 2) 7 población de niños a partir de [2-4) 3 la siguiente tabla: [4 - 6) 8 [6 - 8] 7 “1 Desviación media para datos agrupados * Silos datos vienen agrupados en una tabla de frecuencias, la expresión de la desviación media es: Ll [11 SE af; E [Ta 5 | $2 O En == z| fn A N Ad Zi — Tlf; D; il A f 1 Desviación Media para datos agrupados Donde: * fi: frecuencia absoluta de cada valor, es decir, el número de veces que aparece el valor en el estudio. * xi: marca de clase. Es el punto medio del límite inferior y el límite superior de cada intervalo. * k: número de clases. * D. M.: desviación media. * X: media aritmética de los datos. 4) Ejemplo para datos agrupados Edad Frecuencia * Calcular la varianza y la (años) f: desviación estándar de una [O - 2) 7 población de niños a partir de [2-4) 3 la siguiente tabla: [4 - 6) 8 [6 - 8] 7 ha! a A Edad Frecuencia Solución: 5 + En este caso, nos dicen que los datos (a n os) fi aa auna pa Eo anto, usaremos las fórmulas de le población. [O - 2 ) 7 . Ene ps número de 3 elementos de la población N: ms : [2 - 4) M2 [4 - 6) 8 .C ruda de la tabla, calcul l a eri ini [6 - 8] / k rama 2 30 21 | Como segundo paso: » Calcularemos las marcas de clase. Recordemos que la marca de clase xi, es el punto medio del límite Edad | Marcadeclase | Frecuencia inferior y el límite superior de cada (años) Xi fi intervalo. Se calcula con la siguiente [0-2) 2 > fórmula — 1,+L, . x= 3 [2 = 4) 3 8 [4 - 6) 5 8 z [6 - 8] 7 7 + Agregamos una columna más a _ , 0 nuestra tabla para la marca de clase == xi: Como tercer paso: * Calculamos la media Edad — | Marcadecase | Frecuencia ? Ñ Ñ Xx f, poblacional 1: (años) fa . [0 - 2) d 7 7 [2 - 4) 3 8 24 k dia Xi hi [4-6) 5 8 40 N [6 - 8] 7 7 49 mA] Y 30 120 * Agregamos una columna más a nuestra tabla, dónde colofajernos los valores de xi * fi: ha! a A Edad Frecuencia Solución: 5 + En este caso, nos dicen que los datos (a n os) fi aa auna pa Eo anto, usaremos las fórmulas de le población. [O - 2 ) 7 . Ene ps número de 3 elementos de la población N: ms : [2 - 4) M2 [4 - 6) 8 .C ruda de la tabla, calcul l a eri ini [6 - 8] / k rama 2 30 21 | Como segundo paso: » Calcularemos las marcas de clase. Recordemos que la marca de clase xi, es el punto medio del límite Edad | Marcadeclase | Frecuencia inferior y el límite superior de cada (años) Xi fi intervalo. Se calcula con la siguiente [0-2) 2 > fórmula — 1,+L, . x= 3 [2 = 4) 3 8 [4 - 6) 5 8 z [6 - 8] 7 7 + Agregamos una columna más a _ , 0 nuestra tabla para la marca de clase == xi: Como tercer paso: * Calculamos la media Edad — | Marcadecase | Frecuencia ? Ñ Ñ Xx f, poblacional 1: (años) fa . [0 - 2) d 7 7 [2 - 4) 3 8 24 k dia Xi hi [4-6) 5 8 40 N [6 - 8] 7 7 49 mA] Y 30 120 * Agregamos una columna más a nuestra tabla, dónde colofajernos los valores de xi * fi: RANGO INTERCUARTIL * Aplicamos la fórmula: Met its LEN 3 * La media poblacional u tiene un valor de 4 años. omo cuarto paso: + Calculamos la varianza ión: Edad Marca de clase | Frecuencia : 2 de la población: (años E P Yao aa (im? fm? [0- 2) 1 7 7 3 9 63 (2-4) 3 8 24 1 1 8 Ko Flw ¿2 [4 - 6) 5 8 40 1 1 8 is Di=1 (Xi — H) [6 - 8] 7 7 49 3 9 63 N — y 30 120 — Ml] 2 + Agregamos más columnas a nuestra tabla, buscando la forma de la fórmula de la varianza: 1 Resultados: * Aplicamos la fórmula de la varianza de la población: " y? = Ei fia 10? = 142 N 30 * Recuerda que la varianza queda expresada en unidades al cuadrado, por ello, nos queda en años al cuadrado. * Como último Paso, calculamos la desviación estándar, recordando que es la raíz cuadrada positiva de la varianza. * o =wy0? =./4,73 (años)? a =2,175 años + El valor de la desviación estándar poblacional o es de 2,175 años. = 4,73 (años)? RANGO INTERCUARTIL * Aplicamos la fórmula: Met its LEN 3 * La media poblacional u tiene un valor de 4 años. omo cuarto paso: + Calculamos la varianza ión: Edad Marca de clase | Frecuencia : 2 de la población: (años E P Yao aa (im? fm? [0- 2) 1 7 7 3 9 63 (2-4) 3 8 24 1 1 8 Ko Flw ¿2 [4 - 6) 5 8 40 1 1 8 is Di=1 (Xi — H) [6 - 8] 7 7 49 3 9 63 N — y 30 120 — Ml] 2 + Agregamos más columnas a nuestra tabla, buscando la forma de la fórmula de la varianza: 1 Resultados: * Aplicamos la fórmula de la varianza de la población: " y? = Ei fia 10? = 142 N 30 * Recuerda que la varianza queda expresada en unidades al cuadrado, por ello, nos queda en años al cuadrado. * Como último Paso, calculamos la desviación estándar, recordando que es la raíz cuadrada positiva de la varianza. * o =wy0? =./4,73 (años)? a =2,175 años + El valor de la desviaciónestándar poblacional o es de 2,175 años. = 4,73 (años)? RANGO INTERCUARTIL COEFICIENTE DE VARIACIÓN O ÍNDICE DE DISPERSIÓN DE PEARSON A | Rango intercuartílico IQR -— (o rango intercuartil) + Es una estimación estadística de la dispersión de una distribución de datos. Consiste en la diferencia entre el tercer y el primer cuartil. Mediante esta medida se eliminan los valores extremadamente alejados. El rango intercuartílico es altamente recomendable cuando la medida de tendencia central utilizada es la mediana (ya que este estadístico es insensible a posibles irregularidades en los extremos). IQR =Q3-Q1 + En una distribución, encontramos la mitad de los datos, el 50 %, ubicados dentro del rango intercuartilico. » Conforme aumente el IQR, indicará que la dispersión será mayor. + Por lo tanto, en distribuciones con una gran asimetría, (alejadas de la distribución normal o campana de Gauss) es más apropiado medir la tendencia central y la dispersión mediante la mediana y el rango intercuartil respectivamente que con la media aritmética y la desviación típica. + Con el IQR podremos elaborar los diagramas de caja, que es un instrumento muy visual para evaluar la dispersión de una distribución. 4) Ejercicio Sea un conjunto ordenado de las edades de los veinte PECES SMN) sujetos (N=20) de un club. 19 21 24 28 28 29 30 32 33 34 37 40 45 45 52 53 54 56 60 63 Para calcular el rango intercuartílico, tendremos que calcular el primer y el tercer cuartil (Q1 y Q3). Primer cuartil El primer cuartil será el sujeto (N+1)/4=21/4=5,25. Como es decimal, será un número entre el X5=28 y X6=29. ERROR RAI) 19 21 24 28x5-28x6-29 30 32 33 34 37. 40 45 45 52 53 54 56 60 63 El número decimal es el 5,25, por lo que i=5 y d=0,25. El cuartil 1 es: (); = 15+0, 25-(16—25) = 28+0, 25-(29—28) = 28, 25 — o — Tercer cuartil El tercer cuartil es el sujeto 3 +1)/4=63/4=15,75. Como el número es decimal, el cuartil estará entre X15=52 y X16=53. Edad de los socios de un club (ordenados) 19 21 241 1281289 [E20/0 ESO] HE32: 33 34 37 40 45 45 *552%3653 54 56 60 63 El número decimal es el 15,75, por lo que i=15 y d=0,75. El cuartil 3 es: Q3 = 11540, 75-(116—115) = 5240, 75-(53-52) = 52,75 Rango intercuartílico Una vez hemos calculado en primer y tercer cuartil, ya podemos calcular el rango intercuartílico. TQR = Q3-Qí =52,75—28,25= 24,5 COEFICIENTE DE VARIACIÓN O ÍNDICE DE DISPERSIÓN DE PEARSON A | Rango intercuartílico IQR -— (o rango intercuartil) + Es una estimación estadística de la dispersión de una distribución de datos. Consiste en la diferencia entre el tercer y el primer cuartil. Mediante esta medida se eliminan los valores extremadamente alejados. El rango intercuartílico es altamente recomendable cuando la medida de tendencia central utilizada es la mediana (ya que este estadístico es insensible a posibles irregularidades en los extremos). IQR =Q3-Q1 + En una distribución, encontramos la mitad de los datos, el 50 %, ubicados dentro del rango intercuartilico. » Conforme aumente el IQR, indicará que la dispersión será mayor. + Por lo tanto, en distribuciones con una gran asimetría, (alejadas de la distribución normal o campana de Gauss) es más apropiado medir la tendencia central y la dispersión mediante la mediana y el rango intercuartil respectivamente que con la media aritmética y la desviación típica. + Con el IQR podremos elaborar los diagramas de caja, que es un instrumento muy visual para evaluar la dispersión de una distribución. 4) Ejercicio Sea un conjunto ordenado de las edades de los veinte PECES SMN) sujetos (N=20) de un club. 19 21 24 28 28 29 30 32 33 34 37 40 45 45 52 53 54 56 60 63 Para calcular el rango intercuartílico, tendremos que calcular el primer y el tercer cuartil (Q1 y Q3). Primer cuartil El primer cuartil será el sujeto (N+1)/4=21/4=5,25. Como es decimal, será un número entre el X5=28 y X6=29. ERROR RAI) 19 21 24 28x5-28x6-29 30 32 33 34 37. 40 45 45 52 53 54 56 60 63 El número decimal es el 5,25, por lo que i=5 y d=0,25. El cuartil 1 es: (); = 15+0, 25-(16—25) = 28+0, 25-(29—28) = 28, 25 — o — Tercer cuartil El tercer cuartil es el sujeto 3 +1)/4=63/4=15,75. Como el número es decimal, el cuartil estará entre X15=52 y X16=53. Edad de los socios de un club (ordenados) 19 21 241 1281289 [E20/0 ESO] HE32: 33 34 37 40 45 45 *552%3653 54 56 60 63 El número decimal es el 15,75, por lo que i=15 y d=0,75. El cuartil 3 es: Q3 = 11540, 75-(116—115) = 5240, 75-(53-52) = 52,75 Rango intercuartílico Una vez hemos calculado en primer y tercer cuartil, ya podemos calcular el rango intercuartílico. TQR = Q3-Qí =52,75—28,25= 24,5 COEFICIENTE DE VARIACIÓN O ÍNDICE DE DISPERSIÓN DE PEARSON "J Coeficiente de Variación * El coeficiente de variación, también denominado como coeficiente de variación de Pearson, es una medida estadística que nos informa acerca de la dispersión relativa de un conjunto de datos. * Es decir, nos informa al igual que otras medidas de dispersión, de si una variable se mueve mucho, poco, más o menos que otra. 4) Fórmula del coeficiente de variación + Su cálculo se obtiene de dividir la desviación típica entre el valor absoluto de la media del conjunto y por lo general se expresa en porcentaje para su mejor comprensión. * El coeficiente de variación se puede ver expresado con las letras CV o r, dependiendo del manual o la fuente utilizada. Su fórmula es la siguiente: O. cv== [X| + X: variable sobre la que se pretenden calcular la varianza * G,: Desviación típica de la variable X. + | X |: Es la media de la variable X en valor absoluto con X+ O FJ) Fórmula del coeficiente de variación... * El coeficiente de variación se utiliza para comparar conjuntos de datos pertenecientes a poblaciones distintas. Si atendemos a su fórmula, vemos que este tiene en cuenta el valor de la media. Por lo tanto, el coeficiente de variación nos permite tener una medida de dispersión que elimine las posibles distorsiones de las medias de dos o más poblaciones. "J Coeficiente de Variación * El coeficiente de variación, también denominado como coeficiente de variación de Pearson, es una medida estadística que nos informa acerca de la dispersión relativa de un conjunto de datos. * Es decir, nos informa al igual que otras medidas de dispersión, de si una variable se mueve mucho, poco, más o menos que otra. 4) Fórmula del coeficiente de variación + Su cálculo se obtiene de dividir la desviación típica entre el valor absoluto de la media del conjunto y por lo general se expresa en porcentaje para su mejor comprensión. * El coeficiente de variación se puede ver expresado con las letras CV o r, dependiendo del manual o la fuente utilizada. Su fórmula es la siguiente: O. cv== [X| + X: variable sobre la que se pretenden calcular la varianza * G,: Desviación típica de la variable X. + | X |: Es la media de la variable X en valor absoluto con X+ O FJ) Fórmula del coeficiente de variación... * El coeficiente de variación se utiliza para comparar conjuntos de datos pertenecientes a poblaciones distintas. Si atendemos a su fórmula, vemos que este tiene en cuenta el valor de la media. Por lo tanto, el coeficiente de variación nos permite tener una medida de dispersión que elimine las posibles distorsiones de las medias de dos o más poblaciones. | Ejemplos de uso del coeficiente de -— variación en lugar de la desviación típica * Comparación de conjuntos de datos de diferente dimensión * Se quiere comprar la dispersión entre la altura de 50 alumnos de una clase y su peso. Para comparar la altura podríamos utilizar como unidad de medida metros y centímetros y para el peso el kilogramo. Comparar estas dos distribuciones mediante la desviación estándar, no tendría sentido dado que se pretenden medir dos variables cualitativas distintas (una medida de longitudy una de masa). A) Ejemplos de uso del coeficiente de variación en lugar de la desviación típica * Comparar conjuntos con gran diferencia entre medias + Medir el peso de los escarabajos y el de los hipopótamos. + El peso de los escarabajos se mide en gramos o miligramos y el peso de los hipopótamos por lo general se mide en toneladas. Si para nuestra medición convertimos el peso de los escarabajos a toneladas ara que ambas poblaciones estén en la misma escala, utilizar la destRición estándar como medida de dispersión no sería lo adecuado. El peso medio de los escarabajos medido en toneladas sería tan pequeño, que si utilizamos la desviación estándar, apenas habría dispersión en los datos. Esto sería un error dado que el peso entre las diferentes especies de escarabajos puede variar de manera considerable. Fe) Ejemplo de cálculo del coeficiente de a . .)—) Varmacion * Pensemos en una población de elefantes y otra de ratones. La población de elefantes tiene un peso merlo de 5.000 kilogramos y una desviación típica de 400 kilogramos. La población de ratones tiene un peso medio de 15 gramos y una desviación típica de 5 gramos, Si comparáramos la dispersión de ambas poblaciones mediante la desviación típica podríamos pensar que hay mayor dispersión para la población de elefantes que para la de los ratones. * Sin embargo al calcular el coeficiente de variación para ambas poblaciones, nos daríamos cuenta que es justo al contrario. Elefantes: 400/5000=0,08 Ratones: 5/15=0,33 + Si multiplicamos ambos datos por 100, tenemos que el coeficiente de variación para los elefantes es de apenas un 8%, mientras que el de las ratones es de un. 33%. Como consecuencia de la diferencia entre las poblaciones y su peso medio, vemos que la población con mayor dispersión, no es la que tiene una mayor desviación típica. | Ejemplos de uso del coeficiente de -— variación en lugar de la desviación típica * Comparación de conjuntos de datos de diferente dimensión * Se quiere comprar la dispersión entre la altura de 50 alumnos de una clase y su peso. Para comparar la altura podríamos utilizar como unidad de medida metros y centímetros y para el peso el kilogramo. Comparar estas dos distribuciones mediante la desviación estándar, no tendría sentido dado que se pretenden medir dos variables cualitativas distintas (una medida de longitud y una de masa). A) Ejemplos de uso del coeficiente de variación en lugar de la desviación típica * Comparar conjuntos con gran diferencia entre medias + Medir el peso de los escarabajos y el de los hipopótamos. + El peso de los escarabajos se mide en gramos o miligramos y el peso de los hipopótamos por lo general se mide en toneladas. Si para nuestra medición convertimos el peso de los escarabajos a toneladas ara que ambas poblaciones estén en la misma escala, utilizar la destRición estándar como medida de dispersión no sería lo adecuado. El peso medio de los escarabajos medido en toneladas sería tan pequeño, que si utilizamos la desviación estándar, apenas habría dispersión en los datos. Esto sería un error dado que el peso entre las diferentes especies de escarabajos puede variar de manera considerable. Fe) Ejemplo de cálculo del coeficiente de a . .)—) Varmacion * Pensemos en una población de elefantes y otra de ratones. La población de elefantes tiene un peso merlo de 5.000 kilogramos y una desviación típica de 400 kilogramos. La población de ratones tiene un peso medio de 15 gramos y una desviación típica de 5 gramos, Si comparáramos la dispersión de ambas poblaciones mediante la desviación típica podríamos pensar que hay mayor dispersión para la población de elefantes que para la de los ratones. * Sin embargo al calcular el coeficiente de variación para ambas poblaciones, nos daríamos cuenta que es justo al contrario. Elefantes: 400/5000=0,08 Ratones: 5/15=0,33 + Si multiplicamos ambos datos por 100, tenemos que el coeficiente de variación para los elefantes es de apenas un 8%, mientras que el de las ratones es de un. 33%. Como consecuencia de la diferencia entre las poblaciones y su peso medio, vemos que la población con mayor dispersión, no es la que tiene una mayor desviación típica. MEDIDAS DE LA FORMA DE UNA DISTRIBUCIÓN: ASIMETRÍA Y CURTOSIS J En Resumen La estadística descriptiva es una disciplina que proporciona un conjunto de métodos y procedimientos para recopilar información, clasificar, encontrar las características de los datos y hacer una buena interpretación de los mismos; así, es posible emitir una conclusión acertada respecto a un tema de interés. Las medidas de dispersión describen qué tan agrupados o separados están los datos alrededor de 15 valores de tendencia cántra . Aunque existen medidas de dispersión definidas en torno a la mediana, generalmente se definen al comparar los datos con la media. Las medidas más usadas son la varianza, la desviación estan y el coeficiente de variación; también son conocidas la desviación media y el rango. Los sistemas o métodos estadísticos sirven para propósitos descriptivos, organizar y resumir datos numéricos, campos de estudio de la estadística descriptiva. Su aplicación está en diversas áreas, como mercadotecnia, contabilidad, control de calidad, estudios de consumidores, análisis de resultados deportivos, administradores de instituciones, educación, organismos políticos, médicos, entre otros. MEDIDAS DE LA FORMA DE UNA DISTRIBUCIÓN: ASIMETRÍA Y GENERALIDADES Curtosis ASIMETRÍA CURTOSIS J En Resumen La estadística descriptiva es una disciplina que proporciona un conjunto de métodos y procedimientos para recopilar información, clasificar, encontrar las características de los datos y hacer una buena interpretación de los mismos; así, es posible emitir una conclusión acertada respecto a un tema de interés. Las medidas de dispersión describen qué tan agrupados o separados están los datos alrededor de 15 valores de tendencia cántra . Aunque existen medidas de dispersión definidas en torno a la mediana, generalmente se definen al comparar los datos con la media. Las medidas más usadas son la varianza, la desviación estan y el coeficiente de variación; también son conocidas la desviación media y el rango. Los sistemas o métodos estadísticos sirven para propósitos descriptivos, organizar y resumir datos numéricos, campos de estudio de la estadística descriptiva. Su aplicación está en diversas áreas, como mercadotecnia, contabilidad, control de calidad, estudios de consumidores, análisis de resultados deportivos, administradores de instituciones, educación, organismos políticos, médicos, entre otros. MEDIDAS DE LA FORMA DE UNA DISTRIBUCIÓN: ASIMETRÍA Y GENERALIDADES Curtosis ASIMETRÍA CURTOSIS ] COEFICIENTE.ASIMETRÍA Esta medida nos os permite identiticas si los datos se CURVA samernaca distribuyen orma uniforme alrededor del Pon punto Sontral “(Media. aritmética). La asimetría / ' presenta tres estados diferentes [Figura], cada uno a. de los cuales define de forma concisa como están distriaados ne datos respecto al eje de asimetría. ON” OS dice de la _ asimetría es positiva cuando la VA mayoa; los datos se encuentran por encima del Ñ valor media aritmética, la curva zo es Simó ie cuando se distribuyen id aproximadamente la misma cantidad de valores en AS ambos lados de la media y se conoce IN como. asimetría negativa cuando la mayor AA cantidad de datos sé aglomeran en los valores AA menores que la media. "1 Los resultados pueden ser los siguientes: * g1 = O (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media) * g1 > O (distribución asimétrica positiva; existe mayor concentración de valores a la derecha de la media que a su izquierda) * g1 < O (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que a su derecha)“3 FUNCIÓN CURTOSIS Esta medida determina el grado de concentración que presentan los valores en la región central de la distribución. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentración de Mec valores (Leptocúrtica), una la concentración normal (Mesocúrtica) óÓ una baja concentración (Platicúrtica). H A N S ] COEFICIENTE.ASIMETRÍA Esta medida nos os permite identiticas si los datos se CURVA samernaca distribuyen orma uniforme alrededor del Pon punto Sontral “(Media. aritmética). La asimetría / ' presenta tres estados diferentes [Figura], cada uno a. de los cuales define de forma concisa como están distriaados ne datos respecto al eje de asimetría. ON” OS dice de la _ asimetría es positiva cuando la VA mayoa; los datos se encuentran por encima del Ñ valor media aritmética, la curva zo es Simó ie cuando se distribuyen id aproximadamente la misma cantidad de valores en AS ambos lados de la media y se conoce IN como. asimetría negativa cuando la mayor AA cantidad de datos sé aglomeran en los valores AA menores que la media. "1 Los resultados pueden ser los siguientes: * g1 = O (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media) * g1 > O (distribución asimétrica positiva; existe mayor concentración de valores a la derecha de la media que a su izquierda) * g1 < O (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que a su derecha) “3 FUNCIÓN CURTOSIS Esta medida determina el grado de concentración que presentan los valores en la región central de la distribución. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentración de Mec valores (Leptocúrtica), una la concentración normal (Mesocúrtica) óÓ una baja concentración (Platicúrtica). H A N S Descripción * Devuelve la curtosis de un conjunto de datos. La curtosis caracteriza la intensidad de pico o la curvatura relativa de una distribución en. comparación con la distribución normal. Una curtosis positiva indica una distribución relativamente elevada. Una curtosis negativa indica una distribución relativamente plana. Sintaxis CURTOSIS(número1, [número2], ...) * La sintaxis de la función CURTOSIS tiene los siguientes argumentos: * Número1, número2... Númeroi1 es obligatorio, los demás números son opcionales. De 1 a 255 argumentos cuya curtosis puede calcular. También puede usar una matriz única o una referencia de matriz en lugar de argumentos separados por comas. “1 Observaciones * Los argumentos pueden ser números o nombres, matrices o referencias que contengan números. * Se tienen en cuenta los valores lógicos y las representaciones textuales de números escritos directamente en la lista de argumentos. * Si el argumento matricial o de referencia contiene texto, valores lógicos 0 celdas vacías, estos valores se pasan por alto; sin embargo, se Incluirán las celdas con el valor cero. * Los argumentos que son valores de error o texto que no se pueden traducir a números provocan errores. * Si hay menos de cuatro puntos de datos, o si la desviación estándar de la'muestra es igual a cero, curtosis devuelve el ¿+¿DIV/o! +¡VALOR! 1 FUNCIÓN CURTOSIS Los resultados de esta fórmula se interpretan: * (g2 = 0) la distribución es Mesocúrtica: Al igual que en la asimetría es bastante difícil encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos (+ 0.5 aprox.). * (g2 > 0) la distribución es Leptocúrtica * (g2 < 0) la distribución es Platicúrtica Descripción * Devuelve la curtosis de un conjunto de datos. La curtosis caracteriza la intensidad de pico o la curvatura relativa de una distribución en. comparación con la distribución normal. Una curtosis positiva indica una distribución relativamente elevada. Una curtosis negativa indica una distribución relativamente plana. Sintaxis CURTOSIS(número1, [número2], ...) * La sintaxis de la función CURTOSIS tiene los siguientes argumentos: * Número1, número2... Númeroi1 es obligatorio, los demás números son opcionales. De 1 a 255 argumentos cuya curtosis puede calcular. También puede usar una matriz única o una referencia de matriz en lugar de argumentos separados por comas. “1 Observaciones * Los argumentos pueden ser números o nombres, matrices o referencias que contengan números. * Se tienen en cuenta los valores lógicos y las representaciones textuales de números escritos directamente en la lista de argumentos. * Si el argumento matricial o de referencia contiene texto, valores lógicos 0 celdas vacías, estos valores se pasan por alto; sin embargo, se Incluirán las celdas con el valor cero. * Los argumentos que son valores de error o texto que no se pueden traducir a números provocan errores. * Si hay menos de cuatro puntos de datos, o si la desviación estándar de la'muestra es igual a cero, curtosis devuelve el ¿+¿DIV/o! +¡VALOR! 1 FUNCIÓN CURTOSIS Los resultados de esta fórmula se interpretan: * (g2 = 0) la distribución es Mesocúrtica: Al igual que en la asimetría es bastante difícil encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos (+ 0.5 aprox.). * (g2 > 0) la distribución es Leptocúrtica * (g2 < 0) la distribución es Platicúrtica BIOESTADÍSTICA – SEMANA 9 PROBABILIDADES Y Ejemplo + Copie los datos de ejemplo en la tabla siguiente y péguelos en la celda A1 de una hoja de cálculo nueva de Excel. Para que las fórmulas muestren los resultados, selecciónelas, presione F2 y luego ENTRAR. Si lo necesita, puede ajustar el ancho de las columnas para ver todos los datos. 3 4 5 2 3 4 5 6 4 7 Fórmula Descripción Resultado =CURTOSIS( Curtosis del -0,15179963 A2:A11) conjunto de datos anterior BIOESTADÍSTICA -—- SEMANA 9 PROBABILIDADES 7] Nociones de probabilidad + Frecuentista (objetiva): Probabilidad de un suceso es la frecuencia relativa (%) de veces que ocurriría el suceso al realizar un experimento repetidas veces. CLASIFICACION OMS Frecuencia_| Porcentaje Válidos NORMAL 469 46,9% OSTEOPENIA 467 46,7% OSTEOPOROSIS 64 6,4% Total 1000 100,0 CLASIFICACION OMS NORMAL: OSTEOPENI OSTEOPOROSI t I 0 10 20 30 40 50 Porcentaje + Subjetiva (bayesiana): Grado de certeza que se posee sobre un suceso. Es personal. En ambos tipos de definiciones aparece el concepto de suceso. Vamos a ver qué son y algunas operaciones que se pueden realizar con sucesos. Y Ejemplo + Copie los datos de ejemplo en la tabla siguiente y péguelos en la celda A1 de una hoja de cálculo nueva de Excel. Para que las fórmulas muestren los resultados, selecciónelas, presione F2 y luego ENTRAR. Si lo necesita, puede ajustar el ancho de las columnas para ver todos los datos. 3 4 5 2 3 4 5 6 4 7 Fórmula Descripción Resultado =CURTOSIS( Curtosis del -0,15179963 A2:A11) conjunto de datos anterior BIOESTADÍSTICA -—- SEMANA 9 PROBABILIDADES 7] Nociones de probabilidad + Frecuentista (objetiva): Probabilidad de un suceso es la frecuencia relativa (%) de veces que ocurriría el suceso al realizar un experimento repetidas veces. CLASIFICACION OMS Frecuencia_| Porcentaje Válidos NORMAL 469 46,9% OSTEOPENIA 467 46,7% OSTEOPOROSIS 64 6,4% Total 1000 100,0 CLASIFICACION OMS NORMAL: OSTEOPENI OSTEOPOROSI t I 0 10 20 30 40 50 Porcentaje + Subjetiva (bayesiana): Grado de certeza que se posee sobre un suceso. Es personal. En ambos tipos de definiciones aparece el concepto de suceso. Vamos a ver qué son y algunas operaciones que se pueden realizar con sucesos. r _J Sucesos + Cuando se realiza un experimento aleatorio diversos resultados son posibles. El conjunto de todos los resultados posibles se llama espaciomuestral (E). + Se llama suceso a un subconjunto de dichos resultados. * Se llama suceso contrario (complementario) de un suceso A, A”, al formado por los elementos que no están en A * Se llama suceso unión de A y B, AUB, al formado por los resultados experimentales que están en A o en B (incluyendo los que están en ambos. + Se llama suceso intersección de A y B, AMB o simplemente AB, al formado por los elementos que están en A y B UNIÓN INTERS: E espacio muestral E espacio muestral Definición de probabilidad + Se llama probabilidad a cualquier función, P, suceso A un valor numérico P(A), verificando reglas (axiomas) E espacio muestral E espacio muestral o o A E espacio muestral joestadística. U. Málaga. Ing. Liliana má a Sarmiento Barreiro, MSIG que asigna a cada as siguientes E espacio muestral * P(E)=1 100%. E espacio muestral * OSP(A) <1 - P(AUB)=P(A)+P(B) si AMB=0 * Ves el conjunto vacío. . * Podemos imaginar la probabilidad de un subconjunto como el tamaño relativo con respecto al total (suceso seguro) r _J Sucesos + Cuando se realiza un experimento aleatorio diversos resultados son posibles. El conjunto de todos los resultados posibles se llama espacio muestral (E). + Se llama suceso a un subconjunto de dichos resultados. * Se llama suceso contrario (complementario) de un suceso A, A”, al formado por los elementos que no están en A * Se llama suceso unión de A y B, AUB, al formado por los resultados experimentales que están en A o en B (incluyendo los que están en ambos. + Se llama suceso intersección de A y B, AMB o simplemente AB, al formado por los elementos que están en A y B UNIÓN INTERS: E espacio muestral E espacio muestral Definición de probabilidad + Se llama probabilidad a cualquier función, P, suceso A un valor numérico P(A), verificando reglas (axiomas) E espacio muestral E espacio muestral o o A E espacio muestral joestadística. U. Málaga. Ing. Liliana má a Sarmiento Barreiro, MSIG que asigna a cada as siguientes E espacio muestral * P(E)=1 100%. E espacio muestral * OSP(A) <1 - P(AUB)=P(A)+P(B) si AMB=0 * Ves el conjunto vacío. . * Podemos imaginar la probabilidad de un subconjunto como el tamaño relativo con respecto al total (suceso seguro) Probabilidad condicionada + Se llama probabilidad de A condicionada a B, o probabilidad de A sabiendo que pasa B: Error frecuentíiiisimo: O No confundir probabilidad condicionada con intersección. U En ambos medimos efectivamente la intersección, pero... En P(ANB) con respecto a P(E)=1 En P(AIB) con resbecto a P(B1 E espacio muestral P(A)=3/9=1/3 P(B)=5/9 P(AUB)=6/9=2/3 P(AB)=2/9 P(A')=6/9=2/3 P(B')=4/9 E espacio muestral Rinestadistica 11 Málar P(A)=3/9=1/3 E espacio muestral ( P(B)=2/9 P(AUB)=5/9 P(AB)=0 P(A')=6/9=2/3 P(B”)=7/9 E espacio muestral P(A)=3/9=1/3 P(B)=2/9 P(AUB)=3/9=1/3 P(AB)=2/9 P(A')=6/9=2/3 P(B')=7/9 Bioestadística. U. Málaga. Probabilidad condicionada + Se llama probabilidad de A condicionada a B, o probabilidad de A sabiendo que pasa B: Error frecuentíiiisimo: O No confundir probabilidad condicionada con intersección. U En ambos medimos efectivamente la intersección, pero... En P(ANB) con respecto a P(E)=1 En P(AIB) con resbecto a P(B1 E espacio muestral P(A)=3/9=1/3 P(B)=5/9 P(AUB)=6/9=2/3 P(AB)=2/9 P(A')=6/9=2/3 P(B')=4/9 E espacio muestral Rinestadistica 11 Málar P(A)=3/9=1/3 E espacio muestral ( P(B)=2/9 P(AUB)=5/9 P(AB)=0 P(A')=6/9=2/3 P(B”)=7/9 E espacio muestral P(A)=3/9=1/3 P(B)=2/9 P(AUB)=3/9=1/3 P(AB)=2/9 P(A')=6/9=2/3 P(B')=7/9 Bioestadística. U. Málaga. UNIVERSIDAD DE GUAYAQUIL Intulr la probabilidad condicionada A A === ca 5 B P(A) =0,25 P(A) =0,25 P(B) =0,10 P(B) =0,10 P(ANB) = 0,10 P(ANB) = 0,08 ¿Probabilidad de A sabiendo que ha pasado B? P(A|B)=1 P(A|B)=0,8 A | A n a ] B P(A) =0,25 P(A) =0,25 P(B) =0,10 P(B) =0,10 P(ANB) = 0,005 P(ANB) = 0 ¿Probabilidad de A sabiendo que ha pasado B? P(A|B)=0,05 P(A|B)=0 Rinactadíctira 1! há UNIVERSIDAD DE GUAYAQUIL Intulr la probabilidad condicionada A A === ca 5 B P(A) =0,25 P(A) =0,25 P(B) =0,10 P(B) =0,10 P(ANB) = 0,10 P(ANB) = 0,08 ¿Probabilidad de A sabiendo que ha pasado B? P(A|B)=1 P(A|B)=0,8 A | A n a ] B P(A) =0,25 P(A) =0,25 P(B) =0,10 P(B) =0,10 P(ANB) = 0,005 P(ANB) = 0 ¿Probabilidad de A sabiendo que ha pasado B? P(A|B)=0,05 P(A|B)=0 Rinactadíctira 1! há Algunas reglas de cálculo prácticas * Cualquier problema de probabilidad puede resolverse en teoría mediante aplicación de los axiomas. Sin embargo, es más cómodo conocer algunas reglas de cálculo: - P(A')=1-P(A) - P(AUB) = P(A) + P(B) - P(AB) - P(AB) = P(A) P(B|A) = P(B) P(A|B) * Prob. de que pasen A y B es la prob. de A y que también pase B sabiendo que pasó A. Recuento MENOPAUSIA . Ejemplo (1) o a] rua CLASIFICACION NORMAL 189 280 469 OMS OSTEOPENIA 108 359 467 OSTEOPOROSIS 6 58 64 Total 303 697 1000 + Se ha repetido en 1000 ocasiones el experimento de elegir a una mujer de una población muy grande. El resultado está en la tabla. + ¿Cuál es la probabilidad de que una mujer tenga osteoporosis? » P(Osteoporosis)=64/1000=0,064=6,4% + Noción frecuentista de probabilidad + ¿Cuál es la probabilidad de que una mujer no tenga osteoporosis? + P(No Osteoporosis)=1-P(Osteoporsis)=1-64/1000=0,936=93,6% Algunas reglas de cálculo prácticas * Cualquier problema de probabilidad puede resolverse en teoría mediante aplicación de los axiomas. Sin embargo, es más cómodo conocer algunas reglas de cálculo: - P(A')=1-P(A) - P(AUB) = P(A) + P(B) - P(AB) - P(AB) = P(A) P(B|A) = P(B) P(A|B) * Prob. de que pasen A y B es la prob. de A y que también pase B sabiendo que pasó A. Recuento MENOPAUSIA . Ejemplo (1) o a] rua CLASIFICACION NORMAL 189 280 469 OMS OSTEOPENIA 108 359 467 OSTEOPOROSIS 6 58 64 Total 303 697 1000 + Se ha repetido en 1000 ocasiones el experimento de elegir a una mujer de una población muy grande. El resultado está en la tabla. + ¿Cuál es la probabilidad de que una mujer tenga osteoporosis? » P(Osteoporosis)=64/1000=0,064=6,4% + Noción frecuentista de probabilidad + ¿Cuál es la probabilidad de que una mujer no tenga osteoporosis? + P(No Osteoporosis)=1-P(Osteoporsis)=1-64/1000=0,936=93,6% Ml SEMANA 9 * QU — ? AYAQUIL Recuento MENOPAUSIA NO si Tot CLASIFICACION NORMAL 189 280 400 OMS OSTEOPENIA 108 359 467 OSTEOPOROSIS 6 Cs8) || Total 303 69 1000 + ¿Probabilidad de tener osteopenia u osteoporosis? » P(OsteopeniaUOsteoporosis)=P(Osteopenia)+P(Osteoporosis)-P(Osteopenia” Osteoporosis) =467/1000+64/1000=0,531 + Son sucesos disjuntos + Osteopenia f) Osteoporosis=0 + ¿Probabilidad de tener osteoporosis o menopausia? » P(OsteoporosisUMenopausia)=P(Osteoporosis)+P(Menopausia)-P(Osteoporosis Menopausia) =64/1000+697/1000-58/1000=0,703 + No son sucesos disjuntos + ¿Probabilidad de una mujer normal? » P(Normal)=469/1000=0,469 » P(Normal)=1-P(Normal' )=1-P(OsteopeniaU Osteoporosis) =1-0,531=0,469 Ejemplo (111) 1 OMS OSTEOPENIA 108 OSTEOPOROSIS 6 Total 303 * Si es menopáusica... ¿probabilidad de osteoporosis? » P(Osteoporosis| Menopausia)=58/697=0,083 + ¿Probabilidad de menopausia y osteoporosis?» P(Menop ÑN Osteoporosis) = 58/1000=0,058 » Otra forma: P(MenopN Osteopoross) = P(Menop)x P(Osteopoross| Menop) = 5% ga =58/1000= 0,058 1000 697 LA Tabla de contingencia Ml SEMANA 9 * QU — ? AYAQUIL Recuento MENOPAUSIA NO si Tot CLASIFICACION NORMAL 189 280 400 OMS OSTEOPENIA 108 359 467 OSTEOPOROSIS 6 Cs8) || Total 303 69 1000 + ¿Probabilidad de tener osteopenia u osteoporosis? » P(OsteopeniaUOsteoporosis)=P(Osteopenia)+P(Osteoporosis)-P(Osteopenia” Osteoporosis) =467/1000+64/1000=0,531 + Son sucesos disjuntos + Osteopenia f) Osteoporosis=0 + ¿Probabilidad de tener osteoporosis o menopausia? » P(OsteoporosisUMenopausia)=P(Osteoporosis)+P(Menopausia)-P(Osteoporosis Menopausia) =64/1000+697/1000-58/1000=0,703 + No son sucesos disjuntos + ¿Probabilidad de una mujer normal? » P(Normal)=469/1000=0,469 » P(Normal)=1-P(Normal' )=1-P(OsteopeniaU Osteoporosis) =1-0,531=0,469 Ejemplo (111) 1 OMS OSTEOPENIA 108 OSTEOPOROSIS 6 Total 303 * Si es menopáusica... ¿probabilidad de osteoporosis? » P(Osteoporosis| Menopausia)=58/697=0,083 + ¿Probabilidad de menopausia y osteoporosis? » P(Menop ÑN Osteoporosis) = 58/1000=0,058 » Otra forma: P(MenopN Osteopoross) = P(Menop)x P(Osteopoross| Menop) = 5% ga =58/1000= 0,058 1000 697 LA Tabla de contingencia 2 Y] Y1 [ni [n:> Nik Y2 |; |n Mk Yp Mp1 | Mp2 Mpk La misma tabla puede expresarse en frecuencias relativas o proporciones sin más que dividir cada casilla nij por el total N.yY===kjpiij SAL donde nij expresa la frecuencia absoluta observada en las modalidades Xi e Yj refleja la distribución conjunta de X e Y. Las tablas de contingencia hemos dicho que estudia relaciones entre dos variables cualitativas Si queremos estudiar la relación entre el color de ojos y el color del La variable X: Color de ojos x1: ojos claros x2: Ojos Oscuros EJEMPLO. En un hospital psiquiátrico “se hace un estudio en el que participan 30 pacientes con dos tipos de problemas neuronales (altos y bajos), queremos comparar un fármaco nuevo con otro antiguo. ¿Cómo podemos representar esta situación? ¿Cómo podemos ver si el tratamiento nuevo es preferible al anterior? pelo. La variable Y: Color de pelo y1: pelo claro y2: pelo oscuro ¿Cómo construir una tabla de contingencia? Variable X: Tipo de tratamiento x1: antiguo x2: nuevo Variable Y: Problemas neuronales y1: altos y2: bajos 2 Y] Y1 [ni [n:> Nik Y2 |; |n Mk Yp Mp1 | Mp2 Mpk La misma tabla puede expresarse en frecuencias relativas o proporciones sin más que dividir cada casilla nij por el total N.yY===kjpiij SAL donde nij expresa la frecuencia absoluta observada en las modalidades Xi e Yj refleja la distribución conjunta de X e Y. Las tablas de contingencia hemos dicho que estudia relaciones entre dos variables cualitativas Si queremos estudiar la relación entre el color de ojos y el color del La variable X: Color de ojos x1: ojos claros x2: Ojos Oscuros EJEMPLO. En un hospital psiquiátrico “se hace un estudio en el que participan 30 pacientes con dos tipos de problemas neuronales (altos y bajos), queremos comparar un fármaco nuevo con otro antiguo. ¿Cómo podemos representar esta situación? ¿Cómo podemos ver si el tratamiento nuevo es preferible al anterior? pelo. La variable Y: Color de pelo y1: pelo claro y2: pelo oscuro ¿Cómo construir una tabla de contingencia? Variable X: Tipo de tratamiento x1: antiguo x2: nuevo Variable Y: Problemas neuronales y1: altos y2: bajos Los pacientes nos dijeron el tipo de problema y que fármaco tomaban Sujeto1 (alto, antiguo), Sujeto2 (alto, antiguo), Sujeto3 (bajo, antiguo), Sujeto4 (alto, nuevo), Sujetos (alto, nuevo)... Contamos cuantos hay del mismo tipo, es decir: | a = Problemas altos y tratamiento antiguo = 10 b = Problemas bajos y tratamiento antiguo = 4 c = Problemas altos y tratamiento nuevo = 5 d = Problemas bajos y tratamiento nuevo = 11 Id TABLA DE CONTINGENCIA Problemas neuronales (Y) Altos (y1) Bajos (y2) Antiguo (x1) a=10 b=4 Nuevo (x2) c=5D d = 11 Tratamiento (X) Estos 4 valores calculados llamaremos frecuencias absolutas dobles (f), que nos dicen el número de sujetos que hay, con valores específicos de las variables ] FRECUENCIAS MARGINALES Y DISTRIBUCIÓN MARGINAL En la tabla de las frecuencias absolutas dobles anterior, NEIRA INNER SN llamaremos “TOTAL”, en ambos casos. ¡EMINEM om Xx Cada valor llamaremos frecuencia marginal de X La fila del TOTAL llamaremos distribución marginal de Y Cada valor llamaremos frecuencia marginal de Y LAR MENE E al mc na NINE Nc Los pacientes nos dijeron el tipo de problema y que fármaco tomaban Sujeto1 (alto, antiguo), Sujeto2 (alto, antiguo), Sujeto3 (bajo, antiguo), Sujeto4 (alto, nuevo), Sujetos (alto, nuevo)... Contamos cuantos hay del mismo tipo, es decir: | a = Problemas altos y tratamiento antiguo = 10 b = Problemas bajos y tratamiento antiguo = 4 c = Problemas altos y tratamiento nuevo = 5 d = Problemas bajos y tratamiento nuevo = 11 Id TABLA DE CONTINGENCIA Problemas neuronales (Y) Altos (y1) Bajos (y2) Antiguo (x1) a=10 b=4 Nuevo (x2) c=5D d = 11 Tratamiento (X) Estos 4 valores calculados llamaremos frecuencias absolutas dobles (f), que nos dicen el número de sujetos que hay, con valores específicos de las variables ] FRECUENCIAS MARGINALES Y DISTRIBUCIÓN MARGINAL En la tabla de las frecuencias absolutas dobles anterior, NEIRA INNER SN llamaremos “TOTAL”, en ambos casos. ¡EMINEM om Xx Cada valor llamaremos frecuencia marginal de X La fila del TOTAL llamaremos distribución marginal de Y Cada valor llamaremos frecuencia marginal de Y LAR MENE E al mc na NINE Nc Tratamiento Problemas neuronales TOTAL Altos Bajos Antiguo 10 4 10+4 = 14 (f1.) Nuevo 9 11 5+11=16 (f2.) TOTAL 10+5=15 4+11=15 30 (n) (f.1) (f.2) El valor n, se obtiene sumando cualquier distribución marginal, representa el número total de sujetos, que como recordamos son 30 pacientes. FRECUENCIAS CONDICIONALES Y DISTRIBUCION CONDICIONAL Vamos a conocer estos términos con nuestro ejemplo Se trabaja con la tabla de frecuencias absolutas, es decir: Tratamiento Problemas neuronales TOTAL Altos Bajos Antiguo 10 (111) 4 (112) 14 (f1.) Nuevo 9 (121) 11 (122) 16 (f2.) TOTAL 15 (f.1) 15 (f.2) 30 (n) Tratamiento Problemas neuronales TOTAL Altos Bajos Antiguo 10 4 10+4 = 14 (f1.) Nuevo 9 11 5+11=16 (f2.) TOTAL 10+5=15 4+11=15 30 (n) (f.1) (f.2) El valor n, se obtiene sumando cualquier distribución marginal, representa el número total de sujetos, que como recordamos son 30 pacientes. FRECUENCIAS CONDICIONALES Y DISTRIBUCION CONDICIONAL Vamos a conocer estos términos con nuestro ejemplo Se trabaja con la tabla de frecuencias absolutas, es decir: Tratamiento Problemas neuronales TOTAL Altos Bajos Antiguo 10 (111) 4 (112) 14 (f1.) Nuevo 9 (121) 11 (122) 16 (f2.) TOTAL 15 (f.1) 15 (f.2) 30 (n) Podemos NN loto X condicionada LORI Podemos Ne culo Y condicionada LPI Los datos que nos interesan son: (ANNAN! Elo xl NAO ie oe LODO IE La frecuencia Onion Rie e) La frecuencia Onion UPRO talles ¡A Tratamiento | Problemas neuronales (Y) | TOTAL Altos (y1) Bajos (y2) Nuevo (x2) 5 11 16 Las frecuencias condicionales son: Tratamiento | Problemasneuronales (Y) | TOTAL Altos (y1) Bajos (y2) Nuevo (x2) | 9/16=0,3125 | 11/16=0,6875 1 (h(y1/x2)) (h(y2/x2)) Podemos NN loto X condicionada LORI Podemos Ne culo Y condicionada LPI Los datos que nos interesan son: (ANNAN! Elo xl NAO ie oe LODO IE La frecuencia Onion Rie e) La frecuencia Onion UPRO talles ¡A Tratamiento | Problemas neuronales (Y) | TOTAL Altos (y1) Bajos (y2) Nuevo (x2) 5 11 16 Las frecuencias condicionales son: Tratamiento | Problemas neuronales (Y) | TOTAL Altos (y1) Bajos (y2) Nuevo (x2) | 9/16=0,3125 | 11/16=0,6875 1 (h(y1/x2)) (h(y2/x2)) La interpretación Tratamiento | Problemas neuronales (Y) TOTAL Altos (y1) Bajos (y2) Nuevo (x2) | 5/16=0,3125 | 11/16=0,6875 1 (h(y1/x2)) (h(y2/x2)) - El 31,25% de los pacientes con el tratamiento nuevo, tienen problemas neuronales altos - El 68,75% de los pacientes con el tratamiento nuevo, tienen problemas neuronales bajos Es requisito que todos y cada uno de los elementos de la población tengan la misma probabilidad de ser seleccionados (azar) mm de) » Ñ mm ra Q " as Su Se debe tener disponible un listado completo de pim ). mil > a - todos los elementos de la población, a esto se le Al llama MARCO DE MUESTREO. Munciran Donmbombrilíctiom 14) TIPOS DE MUESTREO ALEATORIO SIMPLE (Muestreo Simple al Azar) Cada sujeto tiene una probabilidad igual de ser seleccionado para el estudio. Se necesita una lista numerada de las unidades de la población que se quiere muestrear. | Ejemplo : Cobertura de la vacuna anti- sarampión entre 1200 Pasos : niños de una escuela X : > Determinar el tamaño de la muestra > Muestra = 60 > Numerar los individuos de1an > Hacer una lista de todos los niños > Tirar unidades al azar (probabilidad igual) > Numerarlos de 1 a 1200 > Selección aleatoria de 60 números La interpretación Tratamiento | Problemas neuronales (Y) TOTAL Altos (y1) Bajos (y2) Nuevo (x2) | 5/16=0,3125 | 11/16=0,6875 1 (h(y1/x2)) (h(y2/x2)) - El 31,25% de los pacientes con el tratamiento nuevo, tienen problemas neuronales altos - El 68,75% de los pacientes con el tratamiento nuevo, tienen problemas neuronales bajos Es requisito que todos y cada uno de los elementos de la población tengan la misma probabilidad de ser seleccionados (azar) mm de) » Ñ mm ra Q " as Su Se debe tener disponible un listado completo de pim ). mil > a - todos los elementos de la población, a esto se le Al llama MARCO DE MUESTREO. Munciran Donmbombrilíctiom 14) TIPOS DE MUESTREO ALEATORIO SIMPLE (Muestreo Simple al Azar) Cada sujeto tiene una probabilidad igual de ser seleccionado para el estudio. Se necesita una lista numerada de las unidades de la población que se quiere muestrear. | Ejemplo : Cobertura de la vacuna anti- sarampión entre 1200 Pasos : niños de una escuela X : > Determinar el tamaño de la muestra > Muestra = 60 > Numerar los individuos de1an > Hacer una lista de todos los niños > Tirar unidades al azar (probabilidad igual) > Numerarlos de 1 a 1200 > Selección aleatoria de 60 números A) 2 ——Ká— ALEATORIO SISTEMÁTICO Ejemplo : » Población (N) : 12,000 Muestra requerida (n) : 600 Calcular el intervalo de muestreo (k) = 12,000 / 600 = 20 Escoger el 1er numero al azar [1 - 20] Añadir k para escoger la siguiente unidad y así sucesivamente hasta completar n. MMMM Ar 0 rea pnn0dd Os PERA Muestreo Estratificado. Cuando la muestra incluye subgrupos representativos (estratos) de los elementos de estudio con características específicas: urbano, rural, nivel de instrucción, año académico, carrera, sexo, grupo étnico, edad, paridad etc. En cada estrato para obtener el tamaño de la muestra se puede utilizar el muestreo aleatorio o sistemático. Ejemplo: Estudiantes de la Carrera de Medicina 2005 l año =20% II año=18% TII año =15% IV año=30% A) Muestreo por Racimos (Cluster o Conglomerado) Conglomerados: son unidades geográficas | | Limitantes: financieras, tiempo, geografía y otros (distritos, pueblos, organizaciones, clínicas) obstáculos. Se reducen costos, tiempo y energía al Facultad de Ciencias Económicas considerar que muchas veces las unidades de análisis Facultad de Ciencias Jurídicas y Sociales se encuentran encapsuladas o encerradas en Facultad de Química y Farmacia determinados lugares físicos o geográficos: Conglomerados. Comunidad A = Conglomerado N*1 Unidad de análisis: sujeto o sujetos Unidad Muestral en este caso: conglomerado a través del cual se logra el acceso a la unidad de análisis. Selección en 2 etapas: > Los racimos o conglomerados > En los racimos se seleccionan a los sujetos a ser medidos. Población, Localidades, Viviendas. Croquis. A) 2 ——Ká— ALEATORIO SISTEMÁTICO Ejemplo : » Población (N) : 12,000 Muestra requerida (n) : 600 Calcular el intervalo de muestreo (k) = 12,000 / 600 = 20 Escoger el 1er numero al azar [1 - 20] Añadir k para escoger la siguiente unidad y así sucesivamente hasta completar n. MMMM Ar 0 rea pnn0dd Os PERA Muestreo Estratificado. Cuando la muestra incluye subgrupos representativos (estratos) de los elementos de estudio con características específicas: urbano, rural, nivel de instrucción, año académico, carrera, sexo, grupo étnico, edad, paridad etc. En cada estrato para obtener el tamaño de la muestra se puede utilizar el muestreo aleatorio o sistemático. Ejemplo: Estudiantes de la Carrera de Medicina 2005 l año =20% II año=18% TII año =15% IV año=30% A) Muestreo por Racimos (Cluster o Conglomerado) Conglomerados: son unidades geográficas | | Limitantes: financieras, tiempo, geografía y otros (distritos, pueblos, organizaciones, clínicas) obstáculos. Se reducen costos, tiempo y energía al Facultad de Ciencias Económicas considerar que muchas veces las unidades de análisis Facultad de Ciencias Jurídicas y Sociales se encuentran encapsuladas o encerradas en Facultad de Química y Farmacia determinados lugares físicos o geográficos: Conglomerados. Comunidad A = Conglomerado N*1 Unidad de análisis: sujeto o sujetos Unidad Muestral en este caso: conglomerado a través del cual se logra el acceso a la unidad de análisis. Selección en 2 etapas: > Los racimos o conglomerados > En los racimos se seleccionan a los sujetos a ser medidos. Población, Localidades, Viviendas. Croquis. BIOESTADÍSTICA – SEMANA 10 PROBABILIDADES BIOESTADÍSTICA -— SEMANA 10 PROBABILIDADES Generalidades e B Z 2.5.2.3 Tablas de 2.5.2.4 Independencia 2.5.2.5 Tasa de riesgo 2.5.2.6 Regla de Bayes. probabilidad. y razón de probabilidad. TABLAS DE PROBABILIDAD Una tabla de probaniad es una matriz cuadrada que contiene las probabilidades calculadas dada una función de distribución de probabilidad y un número determinado por el cuál se quiere saber la probabilidad. + Una tabla de probabilidad contiene en la primera columna las únidades y. en la cabecera los decimales y en su interior la probabilidad calculada a partir de una función de probabilidad. | * También se las conoce como tablas de distribución o tablas estadísticas 2.1 Estructura de la tabla z Decimales Decimales Decimales Unidades | Probabilidad Probabilidad Probabilidad Unidades | Probabilidad Probabilidad Probabilidad Unidades | Probabilidad Probabilidad Probabilidad Unidades | Probabilidad Probabilidad Probabilidad Unidades | Probabilidad Probabilidad Probabilidad Generalización de una tabla de probabilidad BIOESTADÍSTICA -— SEMANA 10 PROBABILIDADES Generalidadese B Z 2.5.2.3 Tablas de 2.5.2.4 Independencia 2.5.2.5 Tasa de riesgo 2.5.2.6 Regla de Bayes. probabilidad. y razón de probabilidad. TABLAS DE PROBABILIDAD Una tabla de probaniad es una matriz cuadrada que contiene las probabilidades calculadas dada una función de distribución de probabilidad y un número determinado por el cuál se quiere saber la probabilidad. + Una tabla de probabilidad contiene en la primera columna las únidades y. en la cabecera los decimales y en su interior la probabilidad calculada a partir de una función de probabilidad. | * También se las conoce como tablas de distribución o tablas estadísticas 2.1 Estructura de la tabla z Decimales Decimales Decimales Unidades | Probabilidad Probabilidad Probabilidad Unidades | Probabilidad Probabilidad Probabilidad Unidades | Probabilidad Probabilidad Probabilidad Unidades | Probabilidad Probabilidad Probabilidad Unidades | Probabilidad Probabilidad Probabilidad Generalización de una tabla de probabilidad » No todas las tablas de probabilidad serán iguales, su forma va NS NN AS no ANA SEEN E evitar la confusión. NM Probabilidad des | Probabilidad | Probabilidad | Probabilidad des | Probabilidad Utilidad de las tablas de probabilidad + Las tablas de probabilidad sirven para saber la probabilidad RN eN AR hacer cálculos complejos. + El procedimiento que ahorran las tablas de probabilidad es tener que calcular la probabilidad dado un número riel Mito) ¡xr lo ito LJ INDEPENDENCIA + En teoría de probabilidades, se dice que dos sucesos aleatorios son independientes entre sí cuando la probabilidad de cada uno de ellos no está influida porque el otro suceso ocurra o no, es decir, cuando ambos sucesos no están relacionados. Entonces, dos sucesos son independientes si la ocurrencia de uno de ellos no modifica la probabilidad del otro. Matemáticamente P(A|B)=P(A)P(AIB)=P(A) y P(BIA)=P( B)P(BIA)=P(B). En consecuencia, si dos sucesos son independientes P(ANB)=P(A)-P(B) » No todas las tablas de probabilidad serán iguales, su forma va NS NN AS no ANA SEEN E evitar la confusión. NM Probabilidad des | Probabilidad | Probabilidad | Probabilidad des | Probabilidad Utilidad de las tablas de probabilidad + Las tablas de probabilidad sirven para saber la probabilidad RN eN AR hacer cálculos complejos. + El procedimiento que ahorran las tablas de probabilidad es tener que calcular la probabilidad dado un número riel Mito) ¡xr lo ito LJ INDEPENDENCIA + En teoría de probabilidades, se dice que dos sucesos aleatorios son independientes entre sí cuando la probabilidad de cada uno de ellos no está influida porque el otro suceso ocurra o no, es decir, cuando ambos sucesos no están relacionados. Entonces, dos sucesos son independientes si la ocurrencia de uno de ellos no modifica la probabilidad del otro. Matemáticamente P(A|B)=P(A)P(AIB)=P(A) y P(BIA)=P( B)P(BIA)=P(B). En consecuencia, si dos sucesos son independientes P(ANB)=P(A)-P(B) A A A A o A | Probabilidad de eventos independientes > Ejemplos * Se lanza un dado dos veces. ¿Cuál es la probabilidad de que en el primer lanzamiento resulte 3 y en el segundo lanzamiento un número impar? * Solución: Sean los eventos: + A=Obtener un 3. De seis números posibles, hay un solo 3 >P(A) =1/6 + B=Obtener un número impar. De seis números posibles, tenemos tres impares> P(B) =3/6 =1/2 * Los eventos A y B son independientes, por lo tanto, P(ANB) = P(A) -P(B)= (1/041/2)= 1/12 A | ” ¡E ma mM n + Una persona muy distraída ha extraviado el número telefónico de su mejor amigo, pero logra averiguar las 5 cifras intermedias de un total de 7. Sabiendo además que el primer dígito debe ser par, distinto de o y que la última cifra es impar mayor que 4, ¿cuál es la probabilidad de acertar al número de teléfono de su amigo? » Solución: Solo debe adivinar dos dígitos, el primero y el último. Las posibilidades para el primer número son par y distinto de cero: 2, 4, 6, 8. Las posibilidades para el segundo número son impar y mayor que cuatro: 5, 7,9 Sean los eventos: + A =Acertar el primer dígito. + B=Acertar el segundo dígito. + ANB =Acertar los dos dígitos. + Entonces P(A) =1/4 + Entonces P(B) =1/3 Como son eventos independientes, la probabilidad de acertar los dos dígitos en el número telefónico de su amigo es el producto de ambas probabilidades: P(AN B) = P(A) -P(B)=(1/4)(1/3)=1/12 A A A A o A | Probabilidad de eventos independientes > Ejemplos * Se lanza un dado dos veces. ¿Cuál es la probabilidad de que en el primer lanzamiento resulte 3 y en el segundo lanzamiento un número impar? * Solución: Sean los eventos: + A=Obtener un 3. De seis números posibles, hay un solo 3 >P(A) =1/6 + B=Obtener un número impar. De seis números posibles, tenemos tres impares> P(B) =3/6 =1/2 * Los eventos A y B son independientes, por lo tanto, P(ANB) = P(A) -P(B)= (1/041/2)= 1/12 A | ” ¡E ma mM n + Una persona muy distraída ha extraviado el número telefónico de su mejor amigo, pero logra averiguar las 5 cifras intermedias de un total de 7. Sabiendo además que el primer dígito debe ser par, distinto de o y que la última cifra es impar mayor que 4, ¿cuál es la probabilidad de acertar al número de teléfono de su amigo? » Solución: Solo debe adivinar dos dígitos, el primero y el último. Las posibilidades para el primer número son par y distinto de cero: 2, 4, 6, 8. Las posibilidades para el segundo número son impar y mayor que cuatro: 5, 7,9 Sean los eventos: + A =Acertar el primer dígito. + B=Acertar el segundo dígito. + ANB =Acertar los dos dígitos. + Entonces P(A) =1/4 + Entonces P(B) =1/3 Como son eventos independientes, la probabilidad de acertar los dos dígitos en el número telefónico de su amigo es el producto de ambas probabilidades: P(AN B) = P(A) -P(B)=(1/4)(1/3)=1/12 TASA DE RIESGO Y RAZÓN DE PROBABILIDAD EVENTOS DEPENDIENTES Dos o más eventos serán dependientes cuando la ocurrencia o no- ocurrencia de uno de ellos afecta la probabilidad de ocurrencia del otro (o otros). Cuando tenemos este caso, empleamos entonces, el concepto de probabilidad condicional para denominar la probabilidad del evento relacionado. La expresión P(A|B) indica la probabilidad de ocurrencia del evento A sí el evento B ya ocurrió. + Se debe tener claro que A|B no es una fracción. + P(A[B) =P(A y B/P(B) o P(B|A) = P(A y B)/P(A) Ejemplos: Una caja contiene 4 canicas rojas, 3 canicas verdes y 2 canicas azules. Una canica es eliminada de la caja y no es reemplazada. Otra canica se saca de la caja. Cuál es la probabilidad de que la primera canica sea azul y la segunda canica sea verde? + Yaque la primera canica no es reemplazada, el tamaño del espacio muestral para la primera canica (9) es cambiado para la segunda canica (8) así los eventos son dependientes. + P(azul luego verde) = P(azul) - P(verde) TASA DE RIESGO Y RAZÓN DE PROBABILIDAD LJ Riesgos y tasas a, EVENTOS DEPENDIENTES Dos o más eventos serán dependientes cuando la ocurrencia o no- ocurrencia de uno de ellos afecta la probabilidad de ocurrencia del otro (o otros). Cuando tenemos este caso, empleamos entonces, el concepto de probabilidad condicional para denominar la probabilidad del evento relacionado. La expresión P(A|B) indica la probabilidad de ocurrencia del evento A sí el evento B ya ocurrió. + Se debe tener claro que A|B no es una fracción. + P(A[B) =P(A y B/P(B) o P(B|A) = P(A y B)/P(A) Ejemplos: Una caja contiene 4 canicas rojas, 3 canicas verdes y 2 canicas azules. Una canica es eliminada de la caja y no es reemplazada. Otra canica se saca de la caja. Cuál es la probabilidad de que la primera canica sea azul y la segunda canica
Compartir