Logo Studenta

3 VARIABLES DISTRIBUCIONES

¡Este material tiene más páginas!

Vista previa del material en texto

14/05/2022
1
cvilchezp
DISTRIBUCIONES DE PROBABILIDAD
Una distribución de 
frecuencia muestra las 
frecuencias de ocurrencia 
de las observaciones en un 
conjunto de datos.
“Distribución de frecuencia 
empírica”
“Distribución de 
probabilidad teórica” 
(determinado a partir de modelo 
matemático)
Modelo teórico para calcular la probabilidad de ocurrencia de un evento.
cvilchezp
La distribución de probabilidad muestra cómo el conjunto de todos los posibles 
eventos mutuamente exclusivos está distribuido y pueden ser presentados como 
una ecuación, una gráfico o una tabla. 
Se puede considerar a distribución de probabilidad como el equivalente teórico
de una distribución de frecuencia relativa empírica, con su propia media y varianza.
Una variable, la cual puede 
tomar diferentes valores con 
probabilidades dadas, se 
denomina VARIABLE ALEATORIA 
(AL AZAR)
Una distribución de probabilidad 
comprende todos los valores que 
la variable aleatoria puede 
tomar, con sus probabilidades 
asociadas.
Existe diferentes distribuciones de probabilidad
DISCRETA
(Finito número de 
valores posibles)
CONTINUA
(Infinito número de valores 
posibles en un rango de valores)
14/05/2022
2
Tipos de 
Variables
Cuantitativas
Cualitativas
Discretas:
Solo toma valores 
enteros.
Continuas:
Pueden asumir cualquier valor 
real dentro de un cierto rango.
Nominales: 
Valores son nombres o 
códigos sin relación 
intrínseco entre ellos
Ordinales:
Valores son nombres o 
códigos con relación 
intrínseco entre ellos
cvilchezp
CONSIDERACIONES IMPORTANTES
Los parámetros importantes que describen una variable aleatoria: 
media (Esperanza, E) y la varianza.
Esperanza ̴ Media
E(y) = μy
Var(y) = σ2y = E[(y – uy)
2] = E(y2) – uy
2
σ = Vσ2
14/05/2022
3
cvilchezp
Reglas necesarias a tomar en cuenta cuando una constante 
es multiplicado o adicionado a una variable, o la suma, entre 
si, de dos variables: 
1. La esperanza de una constante c es el valor de la misma constante:
E(c) = c
2. La esperanza de la suma de una constante c a una variable y es la suma de la 
constante y la esperanza de la variable y:
E(c + y) = c + E(y)
3. La esperanza del producto de una constante c y una variable y es igual al 
producto de la constante y la esperanza de la variable y:
E(cy) = cE(y)
4. La esperanza de la suma de dos variables x y y es la suma de las esperanzas 
de las dos variables:
E(x + y) = E(x) + E(y)
cvilchezp
5. La varianza de una constante c es 0: Var(c) = 0
6. La varianza del producto de una constante c y una variable y es el 
producto de la constante al cuadrado multiplicado por la varianza 
de la variable y: Var(cy) = c2 Var(y)
7. La covarianza de dos variables x y y: Cov(x,y) = E[(x – ux) (y – uy)] 
= E(xy) – E(x)E(y)
= E(xy) - uxuy
La covarianza es la variabilidad simultanea de dos variables.
8. La varianza de la suma de dos variables es igual a la suma de 
las varianzas individuales más el doble de la covarianza:
Var(x+y) = Var(x) + Var(y) + 2Cov(x,y)
14/05/2022
4
ZT3034 METODOS ESTADISTICOS APLICADOS A LA CIENCIA ANIMAL
www.lamolina.edu.pe cvilchezp
Carlos Vílchez Perales, Ph.D.
Profesor Principal - Nutrición
VARIABLES ALEATORIAS Y 
SUS DISTRIBUCIONES
cvilchezp
DISTRIBUCIONES DE PROBABILIDAD DISCRETA
Una distribución de probabilidad discreta liga o le asigna una probabilidad a
cada posible evento mutuamente excluyente definido por una variable
aleatoria discreta.
Debe satisfacer:
1. p(xi) > 0; xi ϵ (Rx, Conjunto finito/infinito numerable). (0 < P(x) < 1)
2. Σ p(xi) = 1
(Xi ϵ Rx)
Sea X una variable aleatoria discreta:
p(xi) = (1/2, si xi = 2; 1/3, si xi = 3; 1/6, si xi = 6) 
… entonces, p es una correcta función de probabilidad discreta (puntual) en
Rx = [2, 3, 6] porque sus valores NO son negativas y su suma es 1.
14/05/2022
5
Ejemplo:
Experimento: Lanzar al aire dos monedas. C y S representa, Cara y Sello, 
respectivamente. Sea y una variable aleatoria definida como el número de caras en un 
lanzamiento de dos monedas. Los posibles resultados son: 0, 1 y 2.
Cuál es la distribución de probabilidad de la variable y?
Evento simple = Posible resultado  4 posibles resultados: CC, CS, SC, SS
Presentado en una Tabla:
Evento Simple Resultado y P(y)
E1 CC 2 1/4
E2 CS 1 1/4
E3 SC 1 1/4
E4 SS 0 1/4
De la Tabla se puede observar que:
La probabilidad que y = 2 es P(y=2) = P(E1) = ¼
La probabilidad que y = 1 es P(y=1) = P(E2) + P(E3) = ¼ + ¼ = ½
La probabilidad que y = 0 es P(y=0) = P(E4) = ¼
cvilchezp
cvilchezp
Entonces, la distribución de probabilidad de la variable y es:
y P(y)
0 ¼
1 ½
2 ¼
Condiciones:
1.- 0 < P(y) < 1
2.- Σ (todo y) = P(y=0) + P(y=1) + P(y=2) = ¼ + ½ + ¼ = 1 
14/05/2022
6
cvilchezp
Una distribución probabilidad acumulada F(yi) describe la probabilidad 
que una variable y tiene valores menos que o igual a un valor yi
F(yi) = P(y < yi)
Para el ejemplo del lanzamiento al aire de dos monedas, cuál es la 
distribución acumulada???
y P(y) F(y)
0 ¼ ¼
1 ½ ¾
2 ¼ 4/4
… la probabilidad F(1) = ¾ denota la probabilidad que y (el número de 
caras) sea 0 o 1; es decir, que al lanzar dos monedas se tiene al menos 
un sello (o no se tiene dos caras)
cvilchezp
DISTRIBUCION BINOMIAL
La distribución de probabilidad binomial describe la distribución de diferentes 
valores de la variable y {0, 1, 2, . . ., n} en un total de n experimentos (pruebas).
Características de un experimento binomial: 
1. El experimento consiste de n pruebas equivalentes, independientes 
entre ellos.
2. Existe solo dos resultados posibles de una prueba simple: SI (S) y NO 
(N), o de manera equivalente, 1 y 0.
3. La probabilidad de obtener S es la misma de prueba a prueba, 
representado por p. La probabilidad de N se representa por q, de tal 
manera que p + q = 1. 
4. La variable aleatoria y es el número de éxitos en el total de n pruebas.
14/05/2022
7
cvilchezp
La distribución de la probabilidad de una variable aleatoria y está 
determinado por el parámetro y el número de n pruebas:
donde: p = es la p de éxito en una simple prueba.
q = 1 – p = probabilidad de fracaso en una simple prueba.
La Esperanza y la Varianza de una variable binomial:
E(y) = np y Var(y) = σ2 = npq
cvilchezp
La forma de la distribución depende del parámetro p:
• Es simétrica solamente cuando p = 0.5.
• Es asimétrica en todos los otros casos.
n = 8 ; p = 0.5 n = 8 ; p = 0.2
14/05/2022
8
cvilchezp
Ejemplo: 
Determinar la distribución de probabilidad del número de terneras en tres 
partos consecutivos. Asumir que solo es posible una cría por parto (no 
mellizo) y que la probabilidad de sea hembra en un parto es p = 0.5
La variable aleatoria y está definida como el número de terneras en tres 
consecutivos partos. Los posibles resultados serían: ; 0, 1, 2, 3 (MMM, 
HMM, HHM, HHH)
cvilchezp
y p(y)
0 (0.5)0 (0.5)3 = 0.125
1 (0.5)1 (0.5)2 = 0.375
2
(0.5)2 (0.51 = 0.375
3
(0.5)3 (0.5)0 = 0.125
3
0
3
1
3
2
3
3
Los posibles valores con sus correspondientes probabilidades :
La suma de las probabilidades de todos los posibles valores:
Σi p(yi) = 0.125 + 0.375 + 0.375 + 0.125 = 1
Esperanza: u = E(y) = np = (3)(0.5) = 1.5
Varianza: σ2 = var(y) = npq = (3)(0.5)(0.5) = 0.75 
0
0.1
0.2
0.3
0.4
0 1 2 3
P
ro
b
ab
ili
d
ad
Número deTerneras
14/05/2022
9
cvilchezp
La distribución Poisson se refiere a cierto procesos que pueden ser descritos
con una variable aleatoria discreta. La letra λ suele representar esa variable
y puede, además, asumir valores enteros x (0, 1, 2, 3, etc.).
Formula:
Donde:
λ = representa la variable aleatoria.
x = Valor específico (ocurrencias)
DISTRIBUCION DE POISSON
cvilchezp
A menudo, en lugar del número esperado, se conocen las proporciones
de éxitos la cual es un estimado de la probabilidad de éxitos en una
prueba simple (p). Cuando el valor de p es muy pequeño y el número
total de pruebas (n) es grande, la distribución de Poisson se aproxima a
la distribuciónbinomial.
Una característica de la variable Poisson es que tanto la esperanza 
como la varianza son iguales al parámetro λ. 
E(x) = μ = λ y Var(x) = σ2 = λ
14/05/2022
10
cvilchezp
En general, la distribución de Poisson se deriva del denominado proceso
de Poisson que se asocia al número de ocurrencias de un suceso A en
una región continua, que puede ser un tiempo , una superficie o un
volumen, cuando la ocurrencia de A en un punto de la región es
independiente a la ocurrencia en otro punto.
El proceso de Poisson presupone principalmente que:
1. El número de eventos que ocurren en regiones disjuntas son
independientes.
2. La probabilidad que un evento ocurra dos o más veces en una
región pequeña es virtualmente cero.
3. El parámetro de la distribución del número de eventos que ocurre
en una región dada es proporcional al tamaño de la región.
cvilchezp
Ejemplo 1:
Un Profesor-Tutor de la Facultad de Zootecnia atiende en promedio a cinco 
(5) estudiantes por semana. Cuál es la probabilidad de que en la semana 
siguiente atienda solamente a tres (3) estudiantes?
1. Media o promedio de atención por semana = λ = 5 estudiantes.
2. Número de éxitos que suceden = x = 3 estudiantes.
p(x=3) = 
53 * (2.7182)-5
3!
p(x=3) = 
125 * 1/(2.7182)5
3*2*1
p(x=3) = 0.1404 14.04 %
14/05/2022
11
cvilchezp
Ejemplo 2:
En una población de ratones de laboratorio 2% presentan cuadros de cáncer. 
En una muestra de 300 ratones de laboratorio, cuál es la probabilidad de que 
más de un (1) ratón tenga cáncer? 
1. μ = λ = 300 (0.02) = 6 (Esperado, 2% de 300).
2. p( x > 1).
p(x > 1) = 1 – [p(x =0) + p(x =1)] 
60 * (2.7182)-6
0!
61* (2.7182)-6
1!
p(x > 1) = _
_
1
p(x > 1) = 1 - 0.00248 - 0.01488 = 0.9826
98.26%
14/05/2022
12
cvilchezp
DISTRIBUCIONES DE PROBABILIDAD CONTINUAS
Relación entre las distribuciones de probabilidad discretas y 
continuas
La curva 
que define 
el área se 
denomina: 
cvilchezp
Propiedades de una distribución de probabilidad continua:
1. Una distribución de probabilidad continua está definida por una 
función de densidad de probabilidad. 
2. El área total bajo la función de densidad de probabilidad es 1 (unidad). 
3. La probabilidad de que la variable aleatoria continua está entre ciertos 
límites es igual al área bajo la función de densidad de probabilidad 
entre estos límites.
14/05/2022
13
cvilchezp
Cálculo de probabilidades a partir de la función de densidad de 
probabilidad 
Si la variable de interés es continua, la probabilidad que ese valor esté en 
un intervalo particular está dado por el área relevante bajo la curva de la 
función de densidad de probabilidad.
Prob {x0 < x < x1}
Prob {x < x0}
Prob {x > x1}
Area = proceso matemático = integración.
Tablas  Normal, T-Student, Chi-cuadrado, F.
cvilchezp
DISTRIBUCION NORMAL
• La distribución Normal (N), o distribución Gaussiana, es la más
importante de las distribuciones continuas debido a su rol en la
teoría de muestreo.
• Es una distribución teórica.
• Las observaciones hechas sobre una determinada variable tienen
una distribución de frecuencia empírica la cual es similar a una
distribución N.
• La propiedad, común con otras distribuciones continuas, de que
el área bajo la curva que es definida por su función de densidad
de probabilidad es la unidad (1). La distribución N tiene varias
propiedades útiles.
14/05/2022
14
cvilchezp
PROPIEDADES DE LA DISTRIBUCION NORMAL
• La distribución N está descrito completamente por dos parámetros: Media
(μ) y la desviación estándar (DE, σ).
• Es unimodal.
• Es simétrico en relación a su media.
• La media, mediana y moda son todos iguales.
• Si la DE se mantiene constante, un incremento en el valor de la media mueve 
la curva horizontalmente hacia la derecha. Una disminución en el valor de la 
media mueve la curva horizontalmente hacia la izquierda:
cvilchezp
• Una disminución en la DE hace que la curva se haga más delgada, alta y más 
aguda. Un incremento en la DE hace que la curva sea más ancha, pequeña y 
aplanada: 
• Los límites (μ – σ) y (μ + σ) contienen 68.3 % de la distribución.
• Los límites (μ – 1.96σ) y (μ + 1.96σ) contienen 95 % de la distribución. 
Este hecho es a menudo usado en el cálculo de un rango de referencia 
(intervalo de referencia). 
14/05/2022
15
cvilchezp
• Los límites (μ – 2.586σ) y (μ + 2.58σ) contienen 99 % de la distribución
cvilchezp
Prob {x > x1}
AREAS BAJO LA CURVA Y LA DISTRIBUCION NORMAL ESTANDAR (DNS)
Calcular la probabilidad que un valor de la variable, x, sea mayor que x1.
1. Reconocer que la probabilidad que x tiene un valor mayor que x1 is igual al
área bajo la curva de la distribución N a la derecha de x1. 
2. Definir la media y la desviación estándar de la DN (propia): μ y σ.
14/05/2022
16
cvilchezp
3. Convertir esta distribución N en una distribución Normal estándar, la cual
tiene una media de 0 y una desviación estándar de 1. Esta es la distribución
de una nueva variable, z, llamada Desviación Normal Estandarizada (DNE). 
En términos generales: Para el caso del ejemplo, la DNE 
será: 
cvilchezp
Ejemplo 1:
Carrera de caballos de pura sangre:
Distancia recorrida: 1 200 m.
Tiempo promedio en recorrer esa distancia = μ = 75.2 segundos y con una 
desviación estándar = σ = 2.2 segundos.
Determinar la probabilidad de que un caballo de carrera llegue a la meta 
en menos de 72 segundos??
El valor de z correspondiente a x1 = 72.0 es : 
z1 = (72.0 – 75.2) / (2.2) = - 1.45 
DNE = Simétrica, 0
14/05/2022
17
cvilchezp
- 1.45  DNE  1.45
De la Tabla de DNE: para z = 1.45, la probabilidad es 0.1471 (dos colas)
Para el caso de ejercicio, solo interesa un lado (inferior) del área total: 
0.50 * 0.1471 = 0.0736
Entonces, la probabilidad de que un caballo de carrera 
recorra 1 200 m en menos de 72 segundos es 
aproximadamente 7 %
14/05/2022
18
Ejemplo 2:
Asumir una distribución N teórica de pesos de terneros de 6 m de edad 
definido con u = 200 kg y σ = 20 kg. Determinar la proporción teórica de 
terneros:
a) Más de 230 kg.
b) Menos de 230 kg.
c) Menos de 210 kg y más de 170 kg.
a) Proporción de terneros que pesan más de 230 kg.
Determinar el valor de la variable normal estándar, 
z0, que corresponde al valor y0 = 230.
z0 = 
230 - 200
20
= 1.50
Esto indica que 230 es 1.5 DE por encima de la media
14/05/2022
19
La probabilidad de que y es mayor que y0 es igual a la probabilidad de 
que z sea mayor que z0
P(y > y0 ) = P(z > z0 ) = P(z > 1.50) = 0.0668
Respuesta: El porcentaje esperado de terneros que pesan más de 230 kg es 6.68%
b) Proporción de terneros que pesan menos de 230 kg.
Dado que el área total bajo la curva es igual a 1, entonces la probabilidad 
de que y tenga un valor menor que y0 = 230 kg es: 
P(y < y0 ) = P(z < z0 )
= 1 – P(z < 1.50) 
= 1 – 0.0668 
= 0.9332
Respuesta: El porcentaje esperado de terneros que pesan menos de 230 kg es 93.32%
c) Proporción de terneros que sus pesos estén entre 170 y 210 kg.
y1 = 170 kg
y2 = 210 kg
z1 = 
170 - 200
20
= - 1.50
z2 = 
210 - 200
20
= 0.50
P(y1 < y < y2 ) = P(170 < y < 210) = P( z1 < z < z2 ) = (-1.5 < z < 0.5)
14/05/2022
20
Recordar que la curva es simétrica, lo que significa que: 
P(z < - z0 ) = P(z > z0 ) P(z < - 1.5) = P(z > 1.5)
P( z > 1.5) = 0.0668
P(z > 0.5) = 0.3085
Entonces:
P(170 < y < 210) = P(- 1.5 < z < 0.5) 
= 1 - [P(z > 1.5) + P(z > 0.5)]
= 1 – (0.0668 + 0.3085)
= 0.6247
Respuesta: 
El porcentaje esperado de terneros que pesan entre 170 y 210 kg es 62.47%

Continuar navegando