Logo Studenta

FORMULARIO DE PROBABILIDAD Y ESTADISTICA 1 docx

¡Estudia con miles de materiales!

Vista previa del material en texto

FORMULARIO PARA PROBABILIDAD Y
ESTADÍSTICA
(de acuerdo al programa de Ingeniería Industrial)
UNIDAD 1: ESTADÍSTICA DESCRIPTIVA.
PRESENTACIÓN DE DATOS
Cuadro estadístico: consta de 2 columnas. Los datos
deben ordenarse por orden alfabético o de mayor a
menor.
Tabla estadística: consta de 3 ó más columnas. Se usa
para detallar más la información.
Gráfico de Pastel: se usa para graficar lo que contiene un
cuadro estadístico y que sean de 2 a 6 clases.
Gráfica de barras: es la gráfica que representa mediante
columnas o barras datos procedentes de un cuadro
estadístico o de una tabla estadística. Se recomienda
usar cuando hay 7 ó más categorías.
Histograma: es una gráfica de barras que representa
datos continuos (los que resultan de medir una variable).
En el histograma las barras van pegadas unas a otras.
Polígono de frecuencias: es una línea poligonal que une
los puntos medios de las barras del histograma. Inicia y
termina en el eje X.
Ojiva: es una línea poligonal que representa las
frecuencias acumuladas de una distribución de
frecuencias. Inicia en el eje X y siempre va hacia arriba.
PASOS PARA FORMAR UNA DISTRIBUCIÓN DE
FRECUENCIAS.
1. Calcule el rango R.
R = Dato Mayor – dato menor
2. Calcule el número de clases que tendrá la
distribución de frecuencias. Puede calcularla
sacando raíz cuadrada del número de datos o
usar la fórmula de Sturges, que dice:
Número de clases = 1 + 3.322 Log N
3. Calcule el ancho de clase con la siguiente
fórmula: Ancho =
𝑅+1
𝑛𝑜. 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠
4. Forme la distribución de frecuencias, indicando
la frecuencia de cada clase.
Límites reales: surgen de los límites de clase al restarle
media unidad al límite inferior de cada clase y sumarle
media unidad al límite superior de cada clase.
Dos características de los límites reales es que terminan
en 5 y tienen un decimal más que los límites de clase.
MEDIDAS DE TENDENCIA CENTRAL
Para datos no agrupados
Media: = , si los datos son de una muestra.𝑥
∑𝑥
𝑛
= , si los datos son toda la población.µ
∑𝑥
𝑁
Mediana: = el dato de en medio de una serie𝑥
~
ordenada de datos.
Si el número de datos es par, se suman los dos de en medio y
se dividen entre 2.
Moda: = el dato que más se repite.𝑥
^
Media Armónica es el recíproco del promedio de los
recíprocos de los datos.
Se usa para calcular el promedio de una cantidad cuando
existen dos tipos de unidades, una en el numerador y otra en
el denominador, y la unidad del numerador es la constante.
Su fórmula es:
MAc =
𝑛
∑( 1𝑥 )
Media Geométrica: es la raíz “n”ésima del producto de
los datos. Se usa para calcular el promedio de
crecimiento, en porcentaje, de un fenómeno estadístico.
Su fórmula es:
Mg =
𝑛
∏ 𝑥
n : es el total de datos.
: es el producto de todos los datos.∏ 𝑥
Media Cuadrática: es el promedio de los cuadrados de
los datos. Su fórmula es:
MC =
∑(𝑥2)
𝑛
Para datos agrupados
Media: =𝑥
∑(𝑓∙𝑥)
∑𝑓
Mediana: =𝑥
~
𝐿𝑅𝐼 + 
𝑁
2 − ∑𝑓𝑎
𝑓
𝑚
 ∙𝑎
LRI: límite real de la clase donde está la mediana.
N: total de datos.
Σfa : suma de las frecuencias anteriores a la clase mediana.
a: ancho de clase donde está la mediana.
fm : frecuencia de la clase donde está la mediana.
Moda: =𝑥
^ 𝐿𝑅𝐼 + 
∆
1
∆
1
+∆
2
 ∙𝑎
LRI: límite real de la clase donde está la más alta frecuencia.
a: ancho de clase donde está la moda.
: exceso de la frecuencia de la clase modal con respecto∆
1
 
a la frecuencia de la clase ANTERIOR a la clase modal.
: exceso de la frecuencia de la clase modal con respecto∆
2
 
a la frecuencia de la clase POSTERIOR a la clase modal.
MEDIDAS DE DISPERSIÓN
Rango es la distancia que hay entre el dato menor y el
dato mayor. Su fórmula es:
R = Dato mayor – Dato menor
Desviación: es la distancia de cada dato al promedio. Se
representa por d.
d = 𝑥 − 𝑥
Desviación Media Simple: es el promedio de las
desviaciones absolutas de los datos, esto, sin tomar en
cuenta el signo de la desviación.
; o 𝐷𝑀𝑆 = 
∑ 𝑥−𝑥| |
𝑛 𝐷𝑀𝑆 = 
∑𝑓• 𝑥−𝑥| |
∑𝑓
Varianza: es el promedio de las desviaciones cuadradas
de los datos.
, si los datos son toda la población.𝑉𝐴𝑅 = 
∑(𝑥−µ)2
𝑁
var , si los datos son de una muestra.= 
∑(𝑥−𝑥)
2
𝑛−1
Desviación Estándar: es la raíz cuadrada de la varianza.
Representa el promedio de las desviaciones de los datos.
, si los datos son toda la población.σ = 
∑(𝑥−µ)2
𝑁
, si los datos son de una muestra.𝑠 = 
∑(𝑥−𝑥)
2
𝑛−1
Coeficiente de variación: es el porcentaje que
representa la desviación estándar con respecto al
promedio.
 𝐶𝑉 = 𝑠
𝑥
×100
El coeficiente de variación se usa para hacer comparaciones
entre DOS poblaciones para determinar en cuál de las dos hay
menor variación con respecto a su promedio.
MEDIDAS DE POSICIÓN
Variable estandarizada z
𝑧 = 𝑥−µ σ
Se usa para comparar la posición de dos individuos que
pertenecen a dos poblaciones diferentes.
Cuartil i: es cada una de las cuatro partes en que se
dividió el conjunto de datos o la distribución de
frecuencias.
para datos agrupados.𝑄
𝑖
= 𝐿𝑅𝐼 +
𝑖∙𝑁
4 −∑𝑓𝑎
𝑓
𝑖
∙𝑎
i es el número del cuartil: 1, 2, 3, 4.
Si los datos NO están agrupados, los cuartiles se
obtienen mediante los siguientes criterios:
Q1 = el dato de en medio de los que están debajo
de la mediana.
Q3 = el dato de en medio de los que están arriba
de la mediana.
Q2 = es la mediana.
Percentil x: es cada uno de los 100 valores en que se
divide la distribución de frecuencias.
 𝑃
𝑥
= 𝐿𝑅𝐼 + 
𝑁∙𝑥
100 −∑𝑓𝑎
𝑓
𝑝
 ∙𝑎
x es el número del percentil.
fp es la frecuencia de la clase donde está el
percentil.
Rango Intercuartílico: es la distancia del cuartil 1 al
cuartil 3. Su fórmula es:
IQR = Q3 – Q1
Box Plot o Diagrama de caja: es una gráfico rectangular
de largo igual al IQR; donde inicia el rectángulo es el Q1 y
donde termina es el Q3. Contiene al 50% de los datos.
Dentro de la caja se representa la mediana con una línea
y en los extremos del rectángulo se trazan dos
segmentos de recta de tamaño igual a 1.5 IQR o menor
si los datos extremos están a una distancia menor. Si hay
datos que rebasan estos segmentos, se dibujan con un
asterisco cada uno de ellos.
Q1 Q3
𝑥
~
IQR
MEDIDAS DE FORMA
Coeficiente de sesgo a3 = ;
𝑚
3
𝑠3
𝑚
3
=
∑𝑓∙(𝑥−𝑥)
3
𝑛
Coeficiente de curtosis a4 = ;
𝑚
4
𝑠4
𝑚
4
=
∑𝑓∙(𝑥−𝑥)
4
𝑛
UNIDAD 2: PROBABILIDAD
Fórmula para calcular la probabilidad.
𝑝 = 𝐸𝑆
S: representa el espacio muestral, que son todas las
maneras en que puede ocurrir el experimento.
E: representa las maneras que cumplen el requisito
pedido en el experimento.
Axiomas de Probabilidad:
A1. La probabilidad de cualquier evento A es igual o
mayor que 0 y menor o igual a 1. 0 ≤ P(A) ≤ 1
A2. Si A y B son dos eventos excluyentes, la
probabilidad de que ocurra A o B es:
P(A∪B) = P(A) + P(B)
A3. Si Ac representa a que no ocurra A, entonces la
probabilidad de que no ocurra A es: P(Ac) = 1 – P(A)
A4. Si A y B son dos eventos cualesquiera, la
probabilidad de que ocurra A o B es:
P(A∪B) = P(A) + P(B) – P(A∩B)
Probabilidad condicional: 𝑃 𝐴/𝐵( ) = 𝑃(𝐴∩𝐵)𝑃(𝐵)
Teorema de la multiplicación para eventos dependientes
𝑃 𝐴∩𝐵( ) = 𝑃(𝐴)∙𝑃(𝐵/𝐴)
Teorema de la multiplicación para eventos independ.
𝑃 𝐴∩𝐵( ) = 𝑃(𝐴)∙𝑃(𝐵)
Teorema de Bayes
𝑃 𝐴
𝑘
/𝐵( ) = 𝑃(𝐵/𝐴𝑘)∙𝑃(𝐴𝑘)
𝑖=1
𝑛
∑ 𝑃(𝐵/𝐴
𝑖
)∙𝑃(𝐴
𝑖
)
Técnicas de Conteo.
Permutaciones: 𝑃 𝑛, 𝑟( ) = 𝑛!𝑛−𝑟( )!
Combinaciones: 𝐶 𝑛, 𝑟( ) = 𝑛!𝑟! ∙ 𝑛−𝑟( )!
Permutaciones con elementos indistinguibles:
𝑃 𝑁, 𝑛
1
, 𝑛
2
, 𝑛
3
, …( ) = 𝑁!𝑛
1
!∙𝑛
2
!∙𝑛
3
!∙…
UNIDAD 3: DISTRIBUCIONES DE PROBABILIDAD
DE VARIABLE DISCRETA.
;µ = ∑[𝑥∙𝑝 𝑥( )] 𝑉𝑎𝑟 = ∑ [𝑥2∙𝑝(𝑥)] − µ2
Distribución Binomial
=𝑃(𝑛, 𝑥, 𝑝) 𝑛 𝑥 ( ) • 𝑝𝑥 • (1 − 𝑝)𝑛−𝑥
=µ 𝑛∙𝑝 𝑉𝑎𝑟 = 𝑛∙𝑝∙(1 − 𝑝)
Distribución Hipergeométrica
𝑃 𝑁, 𝑘, 𝑛, 𝑥( ) = 𝑘 𝑥 ( )• 𝑁−𝑘 𝑛−𝑥 ( )𝑁 𝑛 ( )
; = ;𝑝 = 𝑘𝑁 µ 𝑛∙𝑝 𝑉𝑎𝑟 = 𝑛∙𝑝∙(1 − 𝑝)∙
𝑁−𝑛
𝑁−1Distribución de Poisson
; ;𝑃 𝑋 = 𝑥( ) = µ
−𝑥𝑒−µ
𝑥! µ = =
𝑋
𝑡 𝑉𝑎𝑟 =
Distribución Geométrica
; ;𝑃 𝑋 = 𝑥( ) = 𝑝∙(1 − 𝑝)𝑥−1 µ = 1𝑝 𝑉𝑎𝑟 =
1−𝑝
𝑝2
Distribución Binomial Negativa o de Pascal
;𝑃 𝑋 = 𝑥( ) = 𝑥 − 1 𝑟 − 1 ( ) • 𝑝𝑟 • (1 − 𝑝)𝑥−𝑟
µ = 𝑟𝑝
;𝑉𝑎𝑟 = 𝑟(1−𝑝)
𝑝2
𝑥 𝑒𝑠 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑛𝑠𝑎𝑦𝑜𝑠;
.𝑟 𝑒𝑠 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠
UNIDAD 4: DISTRIBUCIONES DE PROBABILIDAD
DE VARIABLE CONTINUA.
;𝑃 𝑎 < 𝑥 < 𝑏( ) =
𝑎
𝑏
∫ 𝑓 𝑥( ) 𝑑𝑥 µ =
−∞
∞
∫ (𝑥∙𝑓 𝑥( )𝑑𝑥)
𝑉𝑎𝑟 =
−∞
∞
∫ (𝑥2∙𝑓(𝑥))
Distribución Exponencial
;𝑃 𝑇 > 𝑡( ) = 𝑒
− 𝑡µ 𝑃 𝑇≤𝑡( ) = 1 − 𝑒
− 𝑡µ
= ;µ
𝑡
1
λ 𝑉𝑎𝑟𝑡 =
1
λ2
Distribución Normal Estandarizada
; ; 𝑓 𝑥( ) = 1
2π
• 𝑒
− 12 𝑧
2
𝑧 = 𝑥−µσ 𝑥 = µ + 𝑧∙σ
;µ = 𝑥 − 𝑧∙σ σ = 𝑥−µ𝑧
Distribución Uniforme
Si a ≤ x ≤ b, 𝑃 𝑥
1
≤𝑥≤𝑥
2( ) =
𝑥
2
−𝑥
1
𝑏−𝑎
;µ = 𝑎+𝑏2 𝑉𝑎𝑟 =
(𝑏−𝑎)2
12
Recopilador: Profr. Marco Antonio Cervantes Aguilar
Tecnológico Nacional de México/Instituto Tecnológico de
Nogales; Septiembre 13 de 2014.

Continuar navegando