Logo Studenta

Estadística

¡Este material tiene más páginas!

Vista previa del material en texto

Estadística para Ingenieros
Estadística aplicada a Mediciones
 
Calendario Módulo 1
Fecha Tema Duración
02.08 Introducción
Media
Tamaño de la muestra
1 hora
08.08 Mediana, Moda
Matlab
Cuantiles, Boxplot
Vatrianza, Desv. Estándar, Coeficiente de varianza
2 horas
09.08 Diagrama de frecuencia, Distribución de probabilidad
Matlab, Tarea#1
1 hora
16.08 Distribución normal, PDF, CDF 1 hora
22.08 Distribución uniforme, Distribución Weibull
Matlab, Tarea #2
Indice de correlación, Matriz de correlación
Función de aproximación
2 hora
23.08 Residuos, norma de residuos, Coefficiente de correlación
Extrapolación
Incertidumbre en la medición, Propagación de incertidumbre
Planificación de un experimento
1 horas
29.08 Certamen 2 horas
30.08 Revisión certamen 1 hora
 
¿Qué es la estadística?
● “Estadística es el estudio de los métodos y procedimientos para 
recoger, clasificar, resumir y analizar datos y para hacer 
inferencias científicas partiendos de tales datos.” - El Rincón 
del Vago
● Traducción: Usar herramientas matemáticas para entender lo 
que observamos en la realidad.
● Muchos procesos que observamos (medimos) deben ser 
cuantificados para después poder analizarlos.
● Muchas veces no podemos medir TODOS los eventos y 
debemos hacer una estimación o aproximación.
● Todas las mediciones que hacemos están sujetos a cierta 
incertidumbre que afecta el resultado.
 
Libros Guía
● Buena introducción a la 
estadística fundamental
● Ejemplos de diagramas
● Buenas definiciones de la 
nomenclatura estadística
● Muchos ejerccios con 
MATLAB
 
Energía eólica
● Determinar el potencial eólico de un sitio
● A = superficie barrida = r2.π = (35m)2.3.1415 = 3,850 m2
ρ = densidad de aire = 1.225 kg/m3
vviento = velocidad del viento = 10 m/s
cp = coeficiente de potencia (40% - 50%)
● Al año “cosechamos” 0.9 MW * 24 Hr/día * 365 día/año = 
7.9 Gwh, sufiente energía para 1,500 personas (600 W de 
consumo promedio por persona).
Pviento=cp⋅
ρ
2
⋅A⋅v viento
3
A
r
Pviento=0.4⋅
1.225kg/m³
2
⋅3,850m²⋅103m³/s³ = 943,250W = 0.9MW
 
Energía eólica
● ¿Eso es así de fácil?
a) El viento no sopla constantemente a una
cierta velocidad, hay que usar un valor
promedio (¿cómo lo determinamos?)
b) ¿Que pasa si determinamos “mal” este
valor? (incertidumbre en la medición)
● vviento = 9 m/s en vez de los 10m/s asumidos
(10% de incertidumbre)
● ¡Obtenemos 23% menos de potencia debido al 10% de 
incertidumbre en la medición de la velocidad! (Por nuestra 
“culpa” dejamos a 400 personas sin energía !!)
● AL MEDIR, ES MUY IMPORTANTE CONOCER LA MAGNITUD
DE INCERTIDUMBRE → ESTADISTICA
A
r
Pviento=0.4⋅
1.225kg/m^3
2
⋅3,850m²⋅93m³/s³ = 2,358,125 W = 0.69MW
 
Energía eólica
● Para poder evaluar un sitio con respecto a 
su utilidad para una turbina eólica, se 
recomienda:
– Registrar la velocidad del viento en el lugar 
durante dos años
– Medir en varias alturas, similares a la altura 
de la turbina
– Medir la dirección del viento
– Promediar los datos cada 10 minutos (no 
importan las ráfagas de viento más cortas 
que 10 minutos)
● Estudios preliminares en Chile están 
disponibles en el EXPLORADOR EÓLICO
– Velocidades numericamente calculados
– Validados con mediciones en algnos sitios
– http://walker.dgf.uchile.cl/Explorador/Eolico2/
 
Parque eólico
 
Estadística inferencial
Medición de la velocidad del viento cada 10 minutos:
- Durante 2 años: 105,120 datos = N
- Durante ½ año: 26,280 datos = n
¿El promedio será el mismo? 
Casi siempre trabajamos sólo con una muestra
5.6 m/s
0 m/s 3.8 m/s
1.7 m/s
5.6 m/s7.3 m/s
5.6 m/s
11.1 m/s
13.0 m/s
4.9 m/s 2.3 m/s
9.1 m/s 5.8 m/s
5.6 m/s
3.9 m/s 5.1 m/s
5.9 m/s
8.1 m/s
3.9 m/s
6.6 m/s
12.6 m/s
5.6 m/s
17.6 m/s
Vpoblación = 6.55 m/s
Vmuestra = 5.31 m/s
Cantidad “N”
Cantidad “n”
 
Media
μ=
1
N
⋅∑
i=1
N
x i
 
...de la población ...de la muestra 
x=
1
n
⋅∑
i=1
n
x i
0 5 10 15 20 25
0
2
4
6
8
10
12
14
16
18
20
Velocidades de viento
Número de muestra
V
e
lo
ci
d
a
d
 [
m
/s
]
Datos extremos
Valor medio
de la población
 = 6.55
Valor medio
de la muestra 
 = 5.31
μ
x
 
¿Cómo influye el tamaño de la muestra?
● Se requiere una cantidad significativa para la muestra
● Depende del margen de error esperado
● Se puede calcular!!
0 5 10 15 20 25
0.00
1.00
2.00
3.00
4.00
5.00
6.00
7.00
8.00
Promedio acumulativo
Cantidad de muestras
P
ro
m
e
d
i o
 [
m
/s
]
Valor medio
de la población
 = 6.55
5%
10%
Margen de error
μ
 
Tamaño de la muestra
n=
N⋅Z 2⋅σ2
(N−1)⋅e2+Z 2⋅σ2
● n = El tamaño de la muestra que tenemos que medir
● N = Tamaño de la población (105,120 mediciones en dos años)
● Z = Es la desviación del valor medio que aceptamos para lograr el nivel de 
confianza deseado.
– Nivel de confianza 90% → Z=1,645
– Nivel de confianza 95% -> Z=1,96
– Nivel de confianza 99% -> Z=2,575
● e = Es el margen de error máximo que admitimos (ejemplo: e = 5% = 0.05)
● σ2 = Es la varianza que esperamos encontrar en la población 
(necesitamos información sobre la dispersión de nuestros datos, desde 
mediciones previas o experiencia, en nuestro ejemplo: σ2 = 15.1)
 
Tamaño de la muestra
● ¿Cuánto tiempo hay que medir, para que el error de nuestra 
medición no sea mayor a un 5%
● Datos:
– N = 105,120 (dos años de medición)
– Z = 1.96 (95% de confianza)
– e = 0.05 (máx. 5% de incertidumbre en el resultado)
– σ2 = 15.1 (Varianza de nuestros datos – después entendemos 
 esto!!)
● n = 26,427 mediciones → 6 meses de medición
n=
N⋅Z 2⋅σ2
(N−1)⋅e2+Z2⋅σ2
1 hora
 
Mediana
● Otra forma para determinar un valor que “mejor” represente los 
datos medidos es la MEDIANA
● Representa el valor que se encuentra en “el centro” de las 
mediciones, si las ordenamos según su valor
Datos originales:
Datos ordenados de menor a mayor:
Centro de los datos = Mediana = 5.6
0 1.7 2.3 3.8 3.9 3.9 4.9 5.1 5.6 5.6 5.6 5.6 5.6 5.8 5.9 6.6 7.3 8.1 9.1 11.1 12.6 13 17.6
5.6 3.8 1.7 5.6 11.1 13 5.8 9.1 5.6 7.3 0 4.9 3.9 12.6 5.6 17.6 5.6 2.3 8.1 5.1 5.9 3.9 6.6
12.1. 23.
Primer 
dato
Último 
dato
~x={
x n+1
2
si n es impar
1
2 (x n2
+x n
2
+1) si n es par
 
0 61 2 2 3 4 5 6 7 8 9 1010111213141415161718
0
1
2
3
4
5
6
Diagrama de Frecuencia
Velocidad [m/s]
F
re
cu
e
n
c i
a
 [-
]
Moda
● Una forma alternativa para determinar el valor “más 
representativo” de nuestras medicioens es la MODA
● Representa el valor que se repite con mayor frecuencia en 
las mediciones
Datos ordenados:
El valor 5.6 se repite 5 veces!
● La Moda, Mo= 5.6
● Esto corresponde al máximo en el diagrama de frecuencia:
0 1.7 2.3 3.8 3.9 3.9 4.9 5.1 5.6 5.6 5.6 5.6 5.6 5.8 5.9 6.6 7.3 8.1 9.1 11.1 12.6 13 17.6
 
a) Media de la población 6.55
b) Media de la muestra 5.31
c) Mediana 5.6
d) Moda 5.6
Resumen
● ¿Y quién tiene razón?
● ¡Todos tienen razón! Depende de lo que quiero analizar...
● Los ingenieros casi siempre usamos la media de la muestra, 
ya que tenemos que hacer mediciones y nunca podemos medir 
toda la población
● Pero mucho cuidado con el tamaño de la muestra!!!!!
● Si la muestra es muy pequeña, hay que repetir la medición 
varias veces y se debe analizar los datos obtenidos.
μ
x
~x
Mo
 
Estadística en MATLAB
● Definir los datos: viento = [5.6 3.8 1.7 5.6 … 3.9 6.6];
● Media: mu = mean(viento)
● Mediana: med = median(viento)
● Moda: mod = mode(viento)
● Diagrama de Frecuencia:
– cantclass = 40;
– hist(viento, cantclass);
 
Cuantiles
● La información del valor medio puede ser insuficiente
● ¿Que pasa con la dispersión de los datos? ¿Todos los datos 
cerca del valor medio? ¿O hay algunos valores extremos?
● El análisis de los cuantiles ayuda a entender la dispersión
(cuartiles = 4, quintiles = 5, ...)
0 1.7 2.3 3.8 3.9 3.9 4.9 5.1 5.6 5.6 5.6 5.6 5.6 5.8 5.9 6.6 7.3 8.1 9.1 11.1 12.6 13 17.6
Rango
0
1. cuartil
4.4 5.64.4 7.7 17.6
2. cuartil 3. cuartil 4. cuartil
MedianaDiagrama de caja y bigote (Boxplot)
● Para visualizar los cuantiles se usa el diagrama de caja
● Para hacer un Diagrama de Caja en Excel: 
https://www.youtube.com/watch?v=NgKhvAXnczY
Max. rango 17.6
3. Cuartil 7.7
Mediana 5.6
1. Cuartil 4.4
Min. Rango 0
1. cuartil
2. cuartil
3. cuartil
4. cuartil
Min. Rango
Mediana
Max. Rango
CAJA
BIGOTE
 
Diagrama de caja y bigote
● Muy útil para visualizar una gran cantidad de datos
● Ejemplo: Mediciones de viento durante una semana, cada 10 
minutos
● Muestra la variabilidad de la mediana a lo largo de la semana 
y la dispersión de los datos
Lu Ma Mi Ju Vi Sa Do
 
Varianza
● Promedio de las distancias de los datos con respecto al valor 
de la media
● Si simplemente sumamos las distancias, sale ZERO!!!
● La varianza suma EL QUADRADO de las distancias
0 5 10 15 20 25
0
2
4
6
8
10
12
14
16
18
20
Velocidades de viento
Número de muestra
V
e
lo
ci
d
a
d
 [m
/s
] Valor medio
de la población
Distancia del dato
de la media
∑
i=1
N
(x i−μ )
N
=0
σ
2
=
∑
i=1
N
(x i−μ )
2
N
 
Varianza
5.6 -0.95 0.91
3.8 -2.75 7.57
1.7 -4.85 23.54
5.6 -0.95 0.91
11.1 4.55 20.68
13 6.45 41.57
5.8 -0.75 0.57
9.1 2.55 6.49
5.6 -0.95 0.91
7.3 0.75 0.56
0 -6.55 42.93
4.9 -1.65 2.73
3.9 -2.65 7.03
12.6 6.05 36.58
5.6 -0.95 0.91
17.6 11.05 122.05
5.6 -0.95 0.91
2.3 -4.25 18.08
8.1 1.55 2.40
5.1 -1.45 2.11
5.9 -0.65 0.43
3.9 -2.65 7.03
6.6 0.05 0.00
x i x i−μ (x i−μ)
2
∑
i=1
n
(x i−μ )
2
=346.90
∑
i=1
N
(x i−μ )
2
N
=
346.90
23
=15.08
σ
2
=15.08 [(ms )
2
]
μ=6.55
 
0
2
4
6
8
10
12
14
16
18
Días
V
e
lo
ci
d
a
d
 d
e
l v
ie
n
to
 [
m
]s
]
Varianza vs. Rango
Rango 11.5 6.2 13.6 13.0 7.9 11.6 7.3
Varianza 5.82 2.15 11.92 8.98 2.47 5.65 2.75
Lu Ma Mi Ju Vi Sa Do 
Mediciones vel. viento durante una semana
● El Rango sobrevalora datos extremos
● La varianza representa mejor la dispersión de los datos
● Un valor pequeño para la varianza significa: La mayoría de los 
datos se encuentran juntos
Datos extremos
 
Varianza de una muestra
● Al calcular la varianza con una muestra de datos, se 
SUBESTIMA el valor de la varianza de la población
● Para ajustar la estimación de la varianza, se calcula la varianza 
de la muestra con (n-1) en vez de N
s2=sn−1
2
=
∑
i=1
n
(x i−x )
2
n−1
σ
2
=
∑
i=1
N
( x i−μ )
2
N
 Varianza de
… la población … la muestra
 
Desviación estándard
● El problema con la varianza es su unidad
● La unidad es siempre el cuadrado de la unidad de la medición
● Para resolver esto se define la desviación estándard:
σ=√σ2=√∑i=1
N
(x i−μ )
2
N
s=√s2=√∑i=1
n
(x i−x )
2
n−1
 Desviación de
… la población … la muestra
 
0
2
4
6
8
10
12
14
16
18
Días
V
e
lo
ci
d
a
d
 d
e
l v
ie
n
to
 [
m
]s
]
Desviación estándard
● La desviación indica el rango en el cual se encuentran la 
mayoría de las mediciones (aprox. 70%)
● Junto con la media permiten una buena caracterisación de 
una medición: 
Media 6.10 3.99 5.99 9.10 5.15 7.90 4.68
Desviación 2.41 1.47 3.45 3.00 1.57 2.38 1.66
Resultado=μ±σ
Lu Ma Mi Ju Vi Sa Do 
Mediciones vel. viento durante una semana
Datos extremos
Media
Desviación
Desviación
 
Coeficiente de variación
● Es un número que se usa para cara comparar la variabilidad de 
los datos de diferentes grupos.
● Es una medida adimensional definida de la siguiente manera
v=
s
x
V=σμ
 
… la población … la muestra
0
2
4
6
8
10
12
14
16
18
Días
V
e
lo
ci
d
a
d
 d
e
l v
ie
n
to
 [
m
]s
]
Lu Ma Mi Ju Vi Sa Do 
Media 6.10 3.99 5.99 9.10 5.15 7.90 4.68
Desviación 2.41 1.47 3.45 3.00 1.57 2.38 1.66
Coef. variación 0.4 0.37 0.58 0.33 0.3 0.3 0.35
 
Estadística en MATLAB
● Cuartiles y Boxplot: q = boxplot(viento);
● Varianza de la muestra: var(viento);
● Varianza de la población: var(viento,1);
● Rango: range(viento);
● Desviación estándard de la muestra: std(viento);
● Desviación estándard de la población: std(viento,1);
● Coeficiente de variación: std(viento)/mean(viento)
2 horas
 
Diagrama de frecuencia
Lu Ma Mi Ju Vi Sa Do
Clase 4 – 5.9 m/s
295 eventos
Clase Frecuencia
0 – 1.9 m/s 8
2.0 – 3.9 m/s 112
4.0 – 5.9 m/s 295
6.0 – 7.9 m/s 273
8.0 – 9.9 m/s 135
10.0 – 11.9 m/s 125
12.0 – 13.9 m/s 34
14.0 – 15.9 m/s 21
15.0 – 17.9 m/s 5
Clase 14 – 15.9 m/s
21 eventos
Ta
bl
a 
d e
F
re
cu
en
ci
a
 
Distribución de probabilidad
● Para cada clase se calcula la probabilidad que ocurra un 
evento dentro de esta clase
Clase Frecuencia Probabilidad
0 – 1.9 m/s 8 0.8%
2.0 – 3.9 m/s 112 11.1%
4.0 – 5.9 m/s 295 29.3%
6.0 – 7.9 m/s 273 27.1%
8.0 – 9.9 m/s 135 13.4%
10.0 – 11.9 m/s 125 12.4%
12.0 – 13.9 m/s 34 3.4%
14.0 – 15.9 m/s 21 2.1%
16.0 – 17.9 m/s 5 0.5%
Total 1008 100%
P i=
ni
N
 
Estadística en MATLAB
● Leer datos desde Excel: data = xlsread ('viento_semana.xls');
 tiempo = data(:,1);
 viento_sem = data(:,2);
 plot(tiempo, viento_sem,'o');
● Histograma con clases: mini = min(viento_sem);
 maxi = max(viento_sem);
 cantclass = 9;
 class = linspace(mini,maxi,cantclass);
 [nn,cc] = hist(viento_sem, class);
bar(cc,nn);
● Distribución de probabilidad: prob_nn = nn / sum(nn);
 bar(cc, prob_nn);
 
Datos de viento
● Los datos se obtuvieron desde una torre de prospección 
eólica ubicado en los cerros de la Universidad de Concepción 
en 2009
● La velocidad del viento se mide en dos alturas diferentes, 
utilizando anemómetros de cuchara
● Los datos se graban en un “datalogger” autónomo y se 
descargan una vez por mes.
● El datalogger graba los datos en un formato “interno” que se 
debe convertir.
Vel. #1 [*10 m/s] Vel. #2 [*10 m/s] Dirección [°]
Ejemplo: Vel#1: 20 → velocidad = 2.0 [m/s]
 
TAREA#1
● Los datos se separararon por semana y día
● Cada grupo recibe un set de datos de una semana (LUNES.xls 
hasta DOMINGO.XLS)
● a) Crear un diagrama de la velocidad vs. días de la semana para 
las dos velocidades. Incluir en el gráfico:
– la media y la deviación estándard de la semana
● b) Para ambas velocidades y cada día de la semana calcular los 
valores:
– Media, Mediana, Moda y Rango
– Crear un diagrama de Caja y Bigote para toda la semana y cada una 
de las dos velocidades
● c) Crear la tabla y el diagrama de distribución de probabilidad para 
ambas velocidades (clases de viento cada 1 m/s) y toda la 
semana. Repetir lo mismo para la dirección (clase de dirección 
cada 10°)
1 hora
 
Distribución Normal
● Eventos estocásticos son eventos aleatorios, es decir no son 
deterministicos y no se puede predecir su comportamiento
● Sólo se puede describir a través de la probabilidad
● Ejemplo: Se ensayan 1000 ampolletas incandescentes para 
determinar su vida útil (después de cuántas horas se queman)
70
7
7
3
6
76
5
79
4
8
2
2
85
1
88
0
90
9
93
8
96
7
9
9
6
10
2
5
10
5
4
1
0
8
3
11
1
2
1
1
4
0
1
1
6
9
11
9
8
1
2
2
7
1
2
5
6
12
8
5
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
Vida útil de ampolletas
Clase de vida útil [hr]
P
ro
b
a
b
ili
d
a
d
 [-
]
 
Distribución Normal
70
7
73
6
76
5
79
4
82
2
85
1
88
0
90
9
93
8
96
7
99
6
10
25
10
54
10
83
11
12
11
40
11
69
11
98
12
27
12
56
12
85
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
Clase de vida útil [hr]
P
ro
b
a
b
ili
d
a
d
 [-
]
Media 998.6 hrs
Desviación 93.9 hrs
1092.5 hrs
904.6 hrs
1186.4 hrs
810.7 hrs
Media μ
1σ 1σ
2σ 2σ
μ
σ
μ+1⋅σ
μ−1⋅σ
μ+2⋅σ
μ−2⋅σ
Contiene .
..de los datos
68.26%
95,44%
μ±1⋅σ
μ±2⋅σ
 70
7
73
6
76
5
79
4
82
2
85
1
88
0
90
9
93
8
96
7
99
6
10
25
10
54
10
83
11
12
11
40
11
69
11
98
12
27
12
56
12
85
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
Clase de vida útil [hr]
P
ro
b
a
b
ili
d
a
d
 [-
]
PDF (x )=
1
σ √2π
⋅e
−
1
2
( x−μσ )
2
,−∞<x<∞ ∫
−∞
+∞
PDF (x )⋅dx=1
Función de DensidadDistribución Gaussiana – Campana de Gauss
y
 
Distribución Gaussiana
● La importancia de esta distribución radica en que permite modelar 
numerosos fenómenos naturales, sociales y psicológicos.
● Algunos ejemplos de variables asociadas a fenómenos naturales 
que siguen el modelo de la normal son:
– caracteres morfológicos de individuos como la estatura
– caracteres fisiológicos como el efecto de un fármaco
– caracteres psicológicos como el cociente intelectual
– nivel de ruido en telecomunicaciones
– incertidumbre al medir ciertas magnitudes
● Se puede determinar: que tan probable es que un cierto fenómeno 
ocurra, aunque no se sepa muy bien porque ocurre.
 
Función de densidad
● No permite determinar directamente la probabilidad que ocurra 
un cierto evento específico, sino solamente la probabilidad 
que ocurra un evento dentro de ciertos límites
70
7
73
6
76
5
79
4
82
2
85
1
88
0
90
9
93
8
96
7
99
6
10
25
10
54
10
83
11
12
11
40
11
69
11
98
12
27
12
56
12
85
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
Clase de vida útil [hr]
P
ro
b
a
b
ili
d
a
d
 [-
]
∫
−∞
1100
PDD (x )⋅dx=0.86=86%
Probabilidad que se 
queme una 
ampolleta antes de 
1100 horas: P=86%
 
700 750 800 850 900 950 1000 1050 1100 1150 1200
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Vida Útil [hrs]
C
D
F
 [
-]
Función de probabilidad acumulada
(Función de distribución )
● Para simplificar la determinación de la probabilidad que ocurra 
un cierto evento, se determina la Función de Distribución 
acumulada (CDF).
● Corresponde a la integración 
de la Función de Densidad 
CDF (x )=∫
−∞
x
PDF (x )⋅dx
Probabilidad que se queme
antes de las 1100 hrs:
CDF(1100) = 0.86 = 86%
 
700 750 800 850 900 950 1000 1050 1100 1150 1200
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Vida Útil [hrs]
C
D
F
 [
-]
Función de probabilidad acumulada
● Para determinar la probabilidad que ocurra un evento entre 
dos límites...
● … se determinan los CDF para ambos valores y se restan.
Probabilidad que se 
queme entre las 
1050 hrs y 1100 hrs 
P = 0.86 - 0.71 = 0.15 
P =15%
CDF(1050) = 0.71
CDF(1100) = 0.86
15%
 
Estadística en MATLAB
● Función de Densidad Normal (Gauss): 
data = xlsread ('ampolletas.xls');
vida = data(:,2);
histfit(vida);
mu = mean(vida);
sigma = std(vida);
mini = min(vida);
maxi = max(vida);
x = linspace(mini,maxi,100);
pdf=normpdf(x, mu, sigma);
pdf_corr = pdf * 1 / sum(pdf);
plot(x, pdf_corr);
● Función de Distribución Acumulada (CDF): 
cdf = normcdf(x, mu, sigma);
plot(x, cdf);
● Cálculo de probabilidad entre límites:
normcdf(1100,mu,sigma) - normcdf(1050, mu, sigma)
 
Distribución uniforme
● Algunos eventos tienen una distribución uniforme de 
probabilidad: Cada evento tiene la misma probabilidad de 
ocurrir.
● Ejemplos: Elegir un número entre 1 y 10, Lanzar un dado, Kino
PDF (x )={
1
b−a
para a≤x≤b
0 para x<a o x>b
CDF (x )={
0 para x<a
x−a
b−a
para x∈[a ,b )
1 para x≥b
 
Distribución Weibull
● El modelo propuesto por Weibull se usa para modelar datos asimétricos.
● Por ejemplo en problemas relacionados con falla de materiales y estudios 
de confiabilidad.
● Muchos procesos técnicos se pueden aproximar con la distribución de 
Weibull (velocidad del viento en un lugar)
● Para estas aplicaciones, Weibull es más flexible que el modelo normal 
gaussiano.
● en donde k>0 es el parámetro de forma y 
● λ>0 es el parámetro de escala
● *** mean, *** varianza
PDF (x ; λ , k )={
k
λ (
k
λ )
k−1
⋅e
−(
x
λ
)
k
x⩾0
0 x<0
 
Distribución Weibull – Función de densidad
● El factor k influye la forma de la distribución
● Con esto se puede modelar la distribución de fallos en un 
sistema técnico (Ejemplo: ampolletas que se queman después 
de cierto tiempo de uso):
– Un valor k < 1 indica que la tasa de fallos decrece con el tiempo.
– Cuando k = 1, la tasa de fallos es constante en el tiempo.
– Un valor k > 1 indica que la tasa de fallos crece con el tiempo.
tiempo [años]
p
r
o
b
a
b
i
l
i
d
a
d
 
Distribución Weibull
● El factor λ influye la escala en el eje “x”
● Aumentando el valor λ corresponde a un “alargamiento” de la 
función de densidad
k = 1
λ = 100
k = 1
λ = 50
k = 1
λ = 200
p
r
o
b
a
b
i
l
i
d
a
d
tiempo
 
Weibull – Probabilidad acumulada
CDF (x )=∫
0
x
PDF (x )⋅dx=1−e
−( xλ )
k
0.51
0.30
● Determina la probabilidad que 
ocurra un evento antes de cierto 
tiempo
● Ejemplo: después de medio año 
de uso, un 51% de las ampolletas 
con k=0.5 (los que se queman 
mucho al principio) se han 
quemado, pero sólo el 30% de las 
ampolletas con k=1.5 (los que se 
queman poco al principio).
● Después de 2 años sin embargo, 
se invierte la situación.
tiempo [años]
p
r
o
b
a
b
i
l
i
d
a
d
0.94
0.76
 
Weibull para medición de viento
k=2.6, λ=9.5
Velocidad del viento [m/s]
P
ro
ba
b i
lid
ad
 [
- ]
● La distribución de Weibull se usa mucho para evaluar la 
medición de la velocidad del viento en un sitio
 
Weibull - ¿y para qué sirve?
● Para poder procesar los datos de viento en la estimación del 
potencial eólico de un sitio, basta con indicar los parámetros 
de forma y escala de Weibull.
● Con estos dos parámetros se puede reconstruir la distribución 
del la velocidad del viento y determinar la energía cosechable 
en el sitio durante un cierto período de tiempo 
(1 año = 8,760 hrs).
λ=4.83, k=1.60
Clase de 
viento
Probabilidad
P(v)
cp [-] Energía 
real 
[MWh]
0 -1 0.08 0.40 0.1
1 - 2 0.14 0.40 3.9
2 - 3 0.16 0.40 20.2
3 - 4 0.15 0.40 53.0
4 - 5 0.13 0.40 97.7
5 - 6 0.10 0.40 143.8
 …. …. …. ….
E viento(v )=cp⋅
ρ
2
⋅A⋅v viento
3
⋅P (v )⋅ΔT
 
Estadística en MATLAB
● Weibull:
 data = xlsread ('viento_semana.xls');
viento = data(:,2);
 param = wblfit(viento);
 escala = param(1);
 forma = param(2);
● Weibull PDF:
x = linspace(min(viento), max(viento), 100);
pdf = wblpdf(x, escala, forma);
 plot(x,pdf);
● Weibull CDF:
cdf = wblcdf(x, escala, forma);
plot(x,cdf);
● Cálculo de probabilidad entre límites:
wblcdf(15, escala, forma) - wblcdf(190, escala, forma)
 
TAREA #2
● Con los datos de viento entregados en la tarea anterior:
● a) Generar diagrama Weibull de la velocidad #1 del viento para 
toda la semana
– Determinar los factores de forma y de escala
● b) Con los datos geométricos de nuestra turbina eólica y 
asumiendo un factor de potencia cp constante de 0.4 (para 
todas las clases de viento):
– Calcular la energía cosechable durante el año (se supone que el 
viento se comporta igual durante todo el año)
2 horas
 
Dependencia entre dos variables
● Al medir dos variables, puede existir una 
dependencia entre ambas.
● Ejemplo: Se mide la velocidad del viento 
en dos alturas diferentes
● La velocidad del viento aumenta con la 
altura, pero la característica del viento 
es la misma
● ¿Cómo se puede determinar la relación 
entre una velocidad y la otra?
 
Dependencia entre dos variables
 
Indice de correlación
● Para determinar la dependencia directa (lineal) entre dos 
variables se define el índice de correlación rXY = corr(X, Y)
● Si X e Y representan dos mediciones, entonces:
● El valor del índice de correlación varía en el intervalo [-1,1] 
r XY=
∑
i=1
n
(x i−x)(y i−y )
n⋅s x⋅s y
x : media de la muestra X
y : media de la muestra Y
s x : desv. estándard de la muestra X
s y : desv. estándard de la muestra Y
n : número de muestras
 
Indice de correlación
● r = 1: existe una correlación positiva perfecta. El índice indica 
una dependencia total entre las dos variables denominada 
relación directa: cuando una de ellas aumenta, la otra también 
lo hace en proporción constante.
● 0 < r < 1: existe una correlación positiva.
● r = 0: no existe relación lineal. Pero esto no necesariamente 
implica que las variables son independientes: pueden existir 
todavía relaciones no lineales entre las dos variables.
● -1 < r < 0: existe una correlación negativa.
● r = -1: existe una correlación negativa perfecta.Indice de correlación
● Ejemplo: Medición del viento en dos alturas
x (viento 1) y (viento 2)
8.8 8 2.33
9.2 8 2.93
9 8 2.63
8 7.1 0.45
7.6 6.7 0.07
7 6.2 0.07
6.7 6 0.27
6.6 5.9 0.39
7 6.1 0.10
6.1 5.7 0.92
... ... ...
(x i−x )(y i−y )
x=7.25 , y=6.60
s x=1.04 , sy=0.98
n=36
r XY=
∑
i=1
n
(x i−x )(y i−y )
n⋅s x⋅s y
r XY=
34.995
36.69
=0.95
Indice de correlación casi 1.0
viento 1 y viento 2 están casi 
perfectamente relacionados
 
Matriz de correlación
● Muchos programas de análisis estadístico determinan la matriz 
de correlación en vez del índice de correlación
R=[r xx r xyr yx r yy ]
r xx : índice de correlación entre X y X
r xy : índice de correlación entre X y Y
⋮
Generalmente nos 
interesa este valor
 
Correlación lineal vs. nolineal
● Existe una relación directa 
(lineal) entre las dos variables
● Se puede aproximar con una 
recta
● Existe una relación indirecta 
(no-lineal) entre las dos 
variables
● Se debe encontrar la mejor 
relación entre ambas variables
 
Función de aproximación
● El método más utilizado para 
encontrar la relación no-lineal entre 
dos variables es la aproximación de 
un polinómio de grado N a los datos
● El grado de polinómio puede ser 
máximo N = n-1 (n cantidad de datos)
● Se busca la función que mejor se 
aproxima a los datos, pero no 
necesariamente tiene que pasar 
exactamente por los datos
● Un grado excesivamente alto resulta 
en una función de aproximación que 
oscila entre los datos
Estadística en MATLAB
● Indice de Correlación:
 data = xlsread ('viento_semana.xls');
viento1 = data(:,2);
viento2 = data(:,3);
R = corrcoef(viento1, viento2);
rxy = R(1,2);
● Aproximación con polinómio:
x = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10];
y = [0, 0.5, 1.2, 2.5, 2.5, 5, 4, 2, 1.5, 1, 0];
n = 4;
p = polyfit(x,y,n); 
● Plot de polinomio
x1 = linspace(0,10,100);
poly = polyval(p,x1);
plot(x1,poly); hold on;
plot(x,y,'o'); hold off; 1 hora
 
Función de aproximación
● Para evaluar con qué exactitud se aproximan los datos con el 
polinomio se puede evaluar los residuales (diferencias entre el 
valor del dato y el valor de la aproximación)
residual i=d i=(y i−y aprox )
 
Función de aproximación
● Para cuantificar la calidad de 
aproximación se calcula la 
norma de los residuales
● En este ejemplo el valor de la 
norma es 1.8115
● Mientras menor la norma, 
mejor es la aproximación a 
los datos
‖d‖=√ ∑i=1
n
d i
2
 
Función de aproximación
 
Función de aproximación
● Sin embargo, la mejor forma de evaluar la calidad de una 
aproximación es através del coeficiente de correlación r²
● Este valor indíca en que porcentaje representa la aproximación a 
los datos: 0 (no representa nada) hasta 1 (representa 
perfectamente)
r 2=1−
∑(y i−yaprox)
2
∑(y i−y )
2 =1−
‖d‖
(n−1)⋅s2
r2=0.77 r2=0.87r2=0.77
 
Función de aproximación
● Mucho cuidado con usar la función de aproximación para 
extrapolar los datos!!!
● Extrapolar significa: calcular resultados fuera del rango de 
datos de la medición
● La función de aproximación
sólo es válido en el rango
para el cuál se tenía
información de datos
En este ejemplo: 0 - 10
zona permitida
(interpolación)
zona “prohibida”
extrapolación
Estadística en MATLAB
● Norma de residuos:
 d = y – polyval(p,x);
nd = norm(d);
● Coeficiente de Correlación R²:
 r2 = 1 - sum(d.^2) / sum((y - mean(y)).^2)
 
Incertidumbre en la medición
● Volvemos ahora a nuestro problema inicial:
● ¿Que pasa si determinamos “mal” el
valor de la velocidad el viento? 
(incertidumbre en la medición)
● vviento = 9 m/s en vez de los 10m/s asumidos
(10% de incertidumbre)
● ¡Obtenemos 23% menos de potencia debido al 10% de 
incertidumbre en la medición de la velocidad!
● La razón por la cual se mide con incertidumbre son dos:
– Los datos de medición tienen fluctuaciones → estadística
– El instrumento con el cual se mide no es perfecto
A
r
 
Incertidumbre en la medición
● Para medir la velocidad del viento se utiliza un anemómetros de 
cazoleta o anemómetro de cuchara
● El anemómetro gira por el impacto del
viento sobre las cucharas
● La velocidad de giro es proporcional
a la velocidad del viento
● Se mide la velocidad de giro con un sensor
magnético que detecta cada revolución de
la rueda de cucharas
U=A0+B0⋅F
A0 : Velocidad de arranque [ m/s]
B0 : Factor de amplificación [ m]
F : Frecuencia de giro [ 1/s]
 
Incertidumbre en la medición
● Del catálogo del instrumento 
obtenemos información sobre la 
calibración
●
●
● Esto resulta en una incertidumbre
total de 
● Esto significa que el resultado de 
la medición de la velocidad del 
viento es:
A0=0.27m/s ± 0.014m/s
Mejor valor Incertidumbre
B0=0.6201m ± 0.027m
±1%
U=(0.27m/s + 0.6201m ⋅ F )±1%
 
Incertidumbre en la medición
● Incertidumbre relativa: wU/U = 0.01 = 1%
– No usa unidades
● Incertidumbre absoluta: wU = 0.1 m/s (para U=10 m/s)
– Usa unidades
● Utilizar incertidumbre absoluta: U = 10m/s ± 0.1 m/s
● Utilizar incertidumbre relativa: U = 10m/s ± 1%
 
Incertidumbre en la medición 
● El anemómetro mide entonces con una
incertidumbre relativa de un 1%
● Si medimos por ejemplo una velocidad
del viento de U=10m/s, tenemos que asumir
que la “verdad” está entre 10m/s – 1% = 9.9m/s y 
10m/s + 1% = 10.1m/s
● ¿Cómo influye esta incertidumbre de la velocidad 
del viento sobre el resultado que nos interesa?
● ¡La velocidad del viento va con la potencia de 3!
● ¿La incertidumbre va tambien con la potencia de 
3? ¿O va tres veces? ?????
Pviento=cp⋅
ρ
2
⋅A⋅v viento
3
 
Propagación de incertidumbre
● La incertidumbre de cada valor medido se propaga hacia el 
resultado final.
● Para poder cuantificar la influencia de la incertidumbre de las 
mediciones se debe determinar esta propagación.
● Si “R” es el resultado que se basa en la medición de n variables 
xi, cada una con su incertidumbre wi, entonces: 
wR=√( ∂R∂ x1⋅w 1)
2
+(
∂R
∂ x 2
⋅w 2)
2
+⋯+(
∂R
∂ xn
⋅w n)
2
R : Función para determinar el resultado de la medición
∂R
∂ x1
 : Derivada parcial de la función con respecto a una variable
x i : Variable de medición
w i : Incertidumbre absoluta de la variable de medición
 
Variable Descripción Valor Incertidumbre
coeficiente de potencia de la turbina 0.40
densidad del aire 1.225 kg/m³
área que cubren las palas 3,850 m²
velocidad del viento 10 m/s
Propagación de incertidumbre
● Ejemplo: R = Pviento=cp⋅
ρ
2
⋅A⋅v viento
3
x1 cp w cp=0.0
x 2 ρ w ρ=0.02 kg/m³
x 3 A w A=50 m²
x 4 vviento w v=0.1 m/sM
e
di
c i
o
ne
s
∂R
∂ x1
=
∂Pviento
∂c p
=
ρ
2
⋅A⋅v viento
3 ∂R
∂ x2
=
∂Pviento
∂ρ
=
cp
2
⋅A⋅v viento
3
∂R
∂ x3
=
∂Pviento
∂A
=c p⋅
ρ
2
⋅v viento
3 ∂R
∂ x4
=
∂Pviento
∂v viento
=cp⋅
ρ
2
⋅A⋅3⋅v viento
2
D
e
riv
a d
as
 
Propagación de incertidumbre
wR=√( ∂R∂ x1⋅w 1)
2
+(
∂R
∂ x2
⋅w 2)
2
+⋯+(
∂R
∂ xn
⋅w n)
2
w Pviento=√(ρ2⋅A⋅v viento3 ⋅w c p)
2
+(
cp
2
⋅A⋅v viento
3
⋅wρ)
2
+
…√(cp⋅ρ2⋅v viento3 ⋅w A)
2
+(cp⋅
ρ
2
⋅A⋅3⋅v viento
2
⋅w v viento)
2
wP viento=√(1.225 kg/m³2 ⋅3,850 m²⋅103 m³/s³⋅0)
2
+(0.42 ⋅3,850⋅10
3
⋅0.02)
2
+
…√(0.4⋅1.2252 ⋅103⋅50)
2
+(0.4⋅1.2252 ⋅3,850⋅3⋅10
2
⋅0.1)
2
 
Propagación de incertidumbre
● Incertidumbre total absoluta:
● Incertidumbre total relativa:
w P viento=√ (0 W )
2
+ (15,400 W )2+ (12,250 W )2+ (28,297.5 W )2
w P viento=√1,187,971,006 W²
w P viento=34,467W=34.5kW
w p
viento
Pviento
=
w p
viento
cp⋅
ρ
2
⋅A⋅v viento
3
=
34,467 W
0.4⋅1.225 kg/m³
2
⋅3,850 m²⋅103 m³/s³
w p
viento
Pviento
=
34,467 W
943,250 W
=0.0365=3.65%
 
Planificación de experimento
● Al preparar y planificar un experimento se debe cuidar la 
selección e instalación de los instrumentos para obtener un 
resulado con incertidumbre mínima.
● Uno se debe preguntar: ¿Cuál de las mediciones que voy a 
realizar, afectará más significativamente la incertidumbre del 
resultado?
● Para la medición de esta magnitud se debe prestar mayor 
atención durante la selección del instrumento. Se debeseleccionarel instrumento que ofrece la menor incertidumbre.
w P viento=√ (0 W )
2
+ (15,400 W )2+ (12,250 W )2+ (28,297.5 W )2
coeficiente
de potencia
densidad área velocidad
 
Planificación de experimento
● La medición de la velocidad es la 
que más aporta a la 
incertidumbre de la potencia
● Un descuido en la medición de la 
velocidad resulta en un aumento 
de la incertidumbre final
● Al seleccionar e instalar el 
sensor de velocidad se debe 
asegurar que la incertidumbre del 
sensor sea mínima.
Importancia Variable Aporte a la 
incertidumbre
relativo
1 velocidad 67%
2 densidad 20%
3 área 13%
4 coeficiente 0%
 
Resumen estadística
● Utilizando las herramientas de la estadística ahora se puede:
– Analizar datos experimentales
– Obtener un resultado significativo de los datos
– Caracterizar la naturaleza de los datos
– Crear un modelo simple
– Entender la influencia de los instrumentos sobre el resultado
1 hora
	Slide 1
	Slide 2
	Slide 3
	Slide 4
	Slide 5
	Slide 6
	Slide 7
	Slide 8
	Slide 9
	Slide 10
	Slide 11
	Slide 12
	Slide 13
	Slide 14
	Slide 15
	Slide 16
	Slide 17
	Slide 18
	Slide 19
	Slide 20
	Slide 21
	Slide 22
	Slide 23
	Slide 24
	Slide 25
	Slide 26
	Slide 27
	Slide 29
	Slide 30
	Slide 31
	Slide 32
	Slide 33
	Slide 34
	Slide 35
	Slide 36
	Slide 37
	Slide 38
	Slide 39
	Slide 40
	Slide 41
	Slide 42
	Slide 43
	Slide 44
	Slide 45
	Slide 46
	Slide 47
	Slide 48
	Slide 49
	Slide 50
	Slide 51
	Slide 52
	Slide 53
	Slide 54
	Slide 55
	Slide 56
	Slide 57
	Slide 58
	Slide 59
	Slide 60
	Slide 61
	Slide 62
	Slide 63
	Slide 64
	Slide 65
	Slide 66
	Slide 68
	Slide 69
	Slide 70
	Slide 71
	Slide 72
	Slide 73
	Slide 74
	Slide 75
	Slide 76
	Slide 77
	Slide 78
	Slide 79

Continuar navegando