Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Estadística para Ingenieros Estadística aplicada a Mediciones Calendario Módulo 1 Fecha Tema Duración 02.08 Introducción Media Tamaño de la muestra 1 hora 08.08 Mediana, Moda Matlab Cuantiles, Boxplot Vatrianza, Desv. Estándar, Coeficiente de varianza 2 horas 09.08 Diagrama de frecuencia, Distribución de probabilidad Matlab, Tarea#1 1 hora 16.08 Distribución normal, PDF, CDF 1 hora 22.08 Distribución uniforme, Distribución Weibull Matlab, Tarea #2 Indice de correlación, Matriz de correlación Función de aproximación 2 hora 23.08 Residuos, norma de residuos, Coefficiente de correlación Extrapolación Incertidumbre en la medición, Propagación de incertidumbre Planificación de un experimento 1 horas 29.08 Certamen 2 horas 30.08 Revisión certamen 1 hora ¿Qué es la estadística? ● “Estadística es el estudio de los métodos y procedimientos para recoger, clasificar, resumir y analizar datos y para hacer inferencias científicas partiendos de tales datos.” - El Rincón del Vago ● Traducción: Usar herramientas matemáticas para entender lo que observamos en la realidad. ● Muchos procesos que observamos (medimos) deben ser cuantificados para después poder analizarlos. ● Muchas veces no podemos medir TODOS los eventos y debemos hacer una estimación o aproximación. ● Todas las mediciones que hacemos están sujetos a cierta incertidumbre que afecta el resultado. Libros Guía ● Buena introducción a la estadística fundamental ● Ejemplos de diagramas ● Buenas definiciones de la nomenclatura estadística ● Muchos ejerccios con MATLAB Energía eólica ● Determinar el potencial eólico de un sitio ● A = superficie barrida = r2.π = (35m)2.3.1415 = 3,850 m2 ρ = densidad de aire = 1.225 kg/m3 vviento = velocidad del viento = 10 m/s cp = coeficiente de potencia (40% - 50%) ● Al año “cosechamos” 0.9 MW * 24 Hr/día * 365 día/año = 7.9 Gwh, sufiente energía para 1,500 personas (600 W de consumo promedio por persona). Pviento=cp⋅ ρ 2 ⋅A⋅v viento 3 A r Pviento=0.4⋅ 1.225kg/m³ 2 ⋅3,850m²⋅103m³/s³ = 943,250W = 0.9MW Energía eólica ● ¿Eso es así de fácil? a) El viento no sopla constantemente a una cierta velocidad, hay que usar un valor promedio (¿cómo lo determinamos?) b) ¿Que pasa si determinamos “mal” este valor? (incertidumbre en la medición) ● vviento = 9 m/s en vez de los 10m/s asumidos (10% de incertidumbre) ● ¡Obtenemos 23% menos de potencia debido al 10% de incertidumbre en la medición de la velocidad! (Por nuestra “culpa” dejamos a 400 personas sin energía !!) ● AL MEDIR, ES MUY IMPORTANTE CONOCER LA MAGNITUD DE INCERTIDUMBRE → ESTADISTICA A r Pviento=0.4⋅ 1.225kg/m^3 2 ⋅3,850m²⋅93m³/s³ = 2,358,125 W = 0.69MW Energía eólica ● Para poder evaluar un sitio con respecto a su utilidad para una turbina eólica, se recomienda: – Registrar la velocidad del viento en el lugar durante dos años – Medir en varias alturas, similares a la altura de la turbina – Medir la dirección del viento – Promediar los datos cada 10 minutos (no importan las ráfagas de viento más cortas que 10 minutos) ● Estudios preliminares en Chile están disponibles en el EXPLORADOR EÓLICO – Velocidades numericamente calculados – Validados con mediciones en algnos sitios – http://walker.dgf.uchile.cl/Explorador/Eolico2/ Parque eólico Estadística inferencial Medición de la velocidad del viento cada 10 minutos: - Durante 2 años: 105,120 datos = N - Durante ½ año: 26,280 datos = n ¿El promedio será el mismo? Casi siempre trabajamos sólo con una muestra 5.6 m/s 0 m/s 3.8 m/s 1.7 m/s 5.6 m/s7.3 m/s 5.6 m/s 11.1 m/s 13.0 m/s 4.9 m/s 2.3 m/s 9.1 m/s 5.8 m/s 5.6 m/s 3.9 m/s 5.1 m/s 5.9 m/s 8.1 m/s 3.9 m/s 6.6 m/s 12.6 m/s 5.6 m/s 17.6 m/s Vpoblación = 6.55 m/s Vmuestra = 5.31 m/s Cantidad “N” Cantidad “n” Media μ= 1 N ⋅∑ i=1 N x i ...de la población ...de la muestra x= 1 n ⋅∑ i=1 n x i 0 5 10 15 20 25 0 2 4 6 8 10 12 14 16 18 20 Velocidades de viento Número de muestra V e lo ci d a d [ m /s ] Datos extremos Valor medio de la población = 6.55 Valor medio de la muestra = 5.31 μ x ¿Cómo influye el tamaño de la muestra? ● Se requiere una cantidad significativa para la muestra ● Depende del margen de error esperado ● Se puede calcular!! 0 5 10 15 20 25 0.00 1.00 2.00 3.00 4.00 5.00 6.00 7.00 8.00 Promedio acumulativo Cantidad de muestras P ro m e d i o [ m /s ] Valor medio de la población = 6.55 5% 10% Margen de error μ Tamaño de la muestra n= N⋅Z 2⋅σ2 (N−1)⋅e2+Z 2⋅σ2 ● n = El tamaño de la muestra que tenemos que medir ● N = Tamaño de la población (105,120 mediciones en dos años) ● Z = Es la desviación del valor medio que aceptamos para lograr el nivel de confianza deseado. – Nivel de confianza 90% → Z=1,645 – Nivel de confianza 95% -> Z=1,96 – Nivel de confianza 99% -> Z=2,575 ● e = Es el margen de error máximo que admitimos (ejemplo: e = 5% = 0.05) ● σ2 = Es la varianza que esperamos encontrar en la población (necesitamos información sobre la dispersión de nuestros datos, desde mediciones previas o experiencia, en nuestro ejemplo: σ2 = 15.1) Tamaño de la muestra ● ¿Cuánto tiempo hay que medir, para que el error de nuestra medición no sea mayor a un 5% ● Datos: – N = 105,120 (dos años de medición) – Z = 1.96 (95% de confianza) – e = 0.05 (máx. 5% de incertidumbre en el resultado) – σ2 = 15.1 (Varianza de nuestros datos – después entendemos esto!!) ● n = 26,427 mediciones → 6 meses de medición n= N⋅Z 2⋅σ2 (N−1)⋅e2+Z2⋅σ2 1 hora Mediana ● Otra forma para determinar un valor que “mejor” represente los datos medidos es la MEDIANA ● Representa el valor que se encuentra en “el centro” de las mediciones, si las ordenamos según su valor Datos originales: Datos ordenados de menor a mayor: Centro de los datos = Mediana = 5.6 0 1.7 2.3 3.8 3.9 3.9 4.9 5.1 5.6 5.6 5.6 5.6 5.6 5.8 5.9 6.6 7.3 8.1 9.1 11.1 12.6 13 17.6 5.6 3.8 1.7 5.6 11.1 13 5.8 9.1 5.6 7.3 0 4.9 3.9 12.6 5.6 17.6 5.6 2.3 8.1 5.1 5.9 3.9 6.6 12.1. 23. Primer dato Último dato ~x={ x n+1 2 si n es impar 1 2 (x n2 +x n 2 +1) si n es par 0 61 2 2 3 4 5 6 7 8 9 1010111213141415161718 0 1 2 3 4 5 6 Diagrama de Frecuencia Velocidad [m/s] F re cu e n c i a [- ] Moda ● Una forma alternativa para determinar el valor “más representativo” de nuestras medicioens es la MODA ● Representa el valor que se repite con mayor frecuencia en las mediciones Datos ordenados: El valor 5.6 se repite 5 veces! ● La Moda, Mo= 5.6 ● Esto corresponde al máximo en el diagrama de frecuencia: 0 1.7 2.3 3.8 3.9 3.9 4.9 5.1 5.6 5.6 5.6 5.6 5.6 5.8 5.9 6.6 7.3 8.1 9.1 11.1 12.6 13 17.6 a) Media de la población 6.55 b) Media de la muestra 5.31 c) Mediana 5.6 d) Moda 5.6 Resumen ● ¿Y quién tiene razón? ● ¡Todos tienen razón! Depende de lo que quiero analizar... ● Los ingenieros casi siempre usamos la media de la muestra, ya que tenemos que hacer mediciones y nunca podemos medir toda la población ● Pero mucho cuidado con el tamaño de la muestra!!!!! ● Si la muestra es muy pequeña, hay que repetir la medición varias veces y se debe analizar los datos obtenidos. μ x ~x Mo Estadística en MATLAB ● Definir los datos: viento = [5.6 3.8 1.7 5.6 … 3.9 6.6]; ● Media: mu = mean(viento) ● Mediana: med = median(viento) ● Moda: mod = mode(viento) ● Diagrama de Frecuencia: – cantclass = 40; – hist(viento, cantclass); Cuantiles ● La información del valor medio puede ser insuficiente ● ¿Que pasa con la dispersión de los datos? ¿Todos los datos cerca del valor medio? ¿O hay algunos valores extremos? ● El análisis de los cuantiles ayuda a entender la dispersión (cuartiles = 4, quintiles = 5, ...) 0 1.7 2.3 3.8 3.9 3.9 4.9 5.1 5.6 5.6 5.6 5.6 5.6 5.8 5.9 6.6 7.3 8.1 9.1 11.1 12.6 13 17.6 Rango 0 1. cuartil 4.4 5.64.4 7.7 17.6 2. cuartil 3. cuartil 4. cuartil MedianaDiagrama de caja y bigote (Boxplot) ● Para visualizar los cuantiles se usa el diagrama de caja ● Para hacer un Diagrama de Caja en Excel: https://www.youtube.com/watch?v=NgKhvAXnczY Max. rango 17.6 3. Cuartil 7.7 Mediana 5.6 1. Cuartil 4.4 Min. Rango 0 1. cuartil 2. cuartil 3. cuartil 4. cuartil Min. Rango Mediana Max. Rango CAJA BIGOTE Diagrama de caja y bigote ● Muy útil para visualizar una gran cantidad de datos ● Ejemplo: Mediciones de viento durante una semana, cada 10 minutos ● Muestra la variabilidad de la mediana a lo largo de la semana y la dispersión de los datos Lu Ma Mi Ju Vi Sa Do Varianza ● Promedio de las distancias de los datos con respecto al valor de la media ● Si simplemente sumamos las distancias, sale ZERO!!! ● La varianza suma EL QUADRADO de las distancias 0 5 10 15 20 25 0 2 4 6 8 10 12 14 16 18 20 Velocidades de viento Número de muestra V e lo ci d a d [m /s ] Valor medio de la población Distancia del dato de la media ∑ i=1 N (x i−μ ) N =0 σ 2 = ∑ i=1 N (x i−μ ) 2 N Varianza 5.6 -0.95 0.91 3.8 -2.75 7.57 1.7 -4.85 23.54 5.6 -0.95 0.91 11.1 4.55 20.68 13 6.45 41.57 5.8 -0.75 0.57 9.1 2.55 6.49 5.6 -0.95 0.91 7.3 0.75 0.56 0 -6.55 42.93 4.9 -1.65 2.73 3.9 -2.65 7.03 12.6 6.05 36.58 5.6 -0.95 0.91 17.6 11.05 122.05 5.6 -0.95 0.91 2.3 -4.25 18.08 8.1 1.55 2.40 5.1 -1.45 2.11 5.9 -0.65 0.43 3.9 -2.65 7.03 6.6 0.05 0.00 x i x i−μ (x i−μ) 2 ∑ i=1 n (x i−μ ) 2 =346.90 ∑ i=1 N (x i−μ ) 2 N = 346.90 23 =15.08 σ 2 =15.08 [(ms ) 2 ] μ=6.55 0 2 4 6 8 10 12 14 16 18 Días V e lo ci d a d d e l v ie n to [ m ]s ] Varianza vs. Rango Rango 11.5 6.2 13.6 13.0 7.9 11.6 7.3 Varianza 5.82 2.15 11.92 8.98 2.47 5.65 2.75 Lu Ma Mi Ju Vi Sa Do Mediciones vel. viento durante una semana ● El Rango sobrevalora datos extremos ● La varianza representa mejor la dispersión de los datos ● Un valor pequeño para la varianza significa: La mayoría de los datos se encuentran juntos Datos extremos Varianza de una muestra ● Al calcular la varianza con una muestra de datos, se SUBESTIMA el valor de la varianza de la población ● Para ajustar la estimación de la varianza, se calcula la varianza de la muestra con (n-1) en vez de N s2=sn−1 2 = ∑ i=1 n (x i−x ) 2 n−1 σ 2 = ∑ i=1 N ( x i−μ ) 2 N Varianza de … la población … la muestra Desviación estándard ● El problema con la varianza es su unidad ● La unidad es siempre el cuadrado de la unidad de la medición ● Para resolver esto se define la desviación estándard: σ=√σ2=√∑i=1 N (x i−μ ) 2 N s=√s2=√∑i=1 n (x i−x ) 2 n−1 Desviación de … la población … la muestra 0 2 4 6 8 10 12 14 16 18 Días V e lo ci d a d d e l v ie n to [ m ]s ] Desviación estándard ● La desviación indica el rango en el cual se encuentran la mayoría de las mediciones (aprox. 70%) ● Junto con la media permiten una buena caracterisación de una medición: Media 6.10 3.99 5.99 9.10 5.15 7.90 4.68 Desviación 2.41 1.47 3.45 3.00 1.57 2.38 1.66 Resultado=μ±σ Lu Ma Mi Ju Vi Sa Do Mediciones vel. viento durante una semana Datos extremos Media Desviación Desviación Coeficiente de variación ● Es un número que se usa para cara comparar la variabilidad de los datos de diferentes grupos. ● Es una medida adimensional definida de la siguiente manera v= s x V=σμ … la población … la muestra 0 2 4 6 8 10 12 14 16 18 Días V e lo ci d a d d e l v ie n to [ m ]s ] Lu Ma Mi Ju Vi Sa Do Media 6.10 3.99 5.99 9.10 5.15 7.90 4.68 Desviación 2.41 1.47 3.45 3.00 1.57 2.38 1.66 Coef. variación 0.4 0.37 0.58 0.33 0.3 0.3 0.35 Estadística en MATLAB ● Cuartiles y Boxplot: q = boxplot(viento); ● Varianza de la muestra: var(viento); ● Varianza de la población: var(viento,1); ● Rango: range(viento); ● Desviación estándard de la muestra: std(viento); ● Desviación estándard de la población: std(viento,1); ● Coeficiente de variación: std(viento)/mean(viento) 2 horas Diagrama de frecuencia Lu Ma Mi Ju Vi Sa Do Clase 4 – 5.9 m/s 295 eventos Clase Frecuencia 0 – 1.9 m/s 8 2.0 – 3.9 m/s 112 4.0 – 5.9 m/s 295 6.0 – 7.9 m/s 273 8.0 – 9.9 m/s 135 10.0 – 11.9 m/s 125 12.0 – 13.9 m/s 34 14.0 – 15.9 m/s 21 15.0 – 17.9 m/s 5 Clase 14 – 15.9 m/s 21 eventos Ta bl a d e F re cu en ci a Distribución de probabilidad ● Para cada clase se calcula la probabilidad que ocurra un evento dentro de esta clase Clase Frecuencia Probabilidad 0 – 1.9 m/s 8 0.8% 2.0 – 3.9 m/s 112 11.1% 4.0 – 5.9 m/s 295 29.3% 6.0 – 7.9 m/s 273 27.1% 8.0 – 9.9 m/s 135 13.4% 10.0 – 11.9 m/s 125 12.4% 12.0 – 13.9 m/s 34 3.4% 14.0 – 15.9 m/s 21 2.1% 16.0 – 17.9 m/s 5 0.5% Total 1008 100% P i= ni N Estadística en MATLAB ● Leer datos desde Excel: data = xlsread ('viento_semana.xls'); tiempo = data(:,1); viento_sem = data(:,2); plot(tiempo, viento_sem,'o'); ● Histograma con clases: mini = min(viento_sem); maxi = max(viento_sem); cantclass = 9; class = linspace(mini,maxi,cantclass); [nn,cc] = hist(viento_sem, class); bar(cc,nn); ● Distribución de probabilidad: prob_nn = nn / sum(nn); bar(cc, prob_nn); Datos de viento ● Los datos se obtuvieron desde una torre de prospección eólica ubicado en los cerros de la Universidad de Concepción en 2009 ● La velocidad del viento se mide en dos alturas diferentes, utilizando anemómetros de cuchara ● Los datos se graban en un “datalogger” autónomo y se descargan una vez por mes. ● El datalogger graba los datos en un formato “interno” que se debe convertir. Vel. #1 [*10 m/s] Vel. #2 [*10 m/s] Dirección [°] Ejemplo: Vel#1: 20 → velocidad = 2.0 [m/s] TAREA#1 ● Los datos se separararon por semana y día ● Cada grupo recibe un set de datos de una semana (LUNES.xls hasta DOMINGO.XLS) ● a) Crear un diagrama de la velocidad vs. días de la semana para las dos velocidades. Incluir en el gráfico: – la media y la deviación estándard de la semana ● b) Para ambas velocidades y cada día de la semana calcular los valores: – Media, Mediana, Moda y Rango – Crear un diagrama de Caja y Bigote para toda la semana y cada una de las dos velocidades ● c) Crear la tabla y el diagrama de distribución de probabilidad para ambas velocidades (clases de viento cada 1 m/s) y toda la semana. Repetir lo mismo para la dirección (clase de dirección cada 10°) 1 hora Distribución Normal ● Eventos estocásticos son eventos aleatorios, es decir no son deterministicos y no se puede predecir su comportamiento ● Sólo se puede describir a través de la probabilidad ● Ejemplo: Se ensayan 1000 ampolletas incandescentes para determinar su vida útil (después de cuántas horas se queman) 70 7 7 3 6 76 5 79 4 8 2 2 85 1 88 0 90 9 93 8 96 7 9 9 6 10 2 5 10 5 4 1 0 8 3 11 1 2 1 1 4 0 1 1 6 9 11 9 8 1 2 2 7 1 2 5 6 12 8 5 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 Vida útil de ampolletas Clase de vida útil [hr] P ro b a b ili d a d [- ] Distribución Normal 70 7 73 6 76 5 79 4 82 2 85 1 88 0 90 9 93 8 96 7 99 6 10 25 10 54 10 83 11 12 11 40 11 69 11 98 12 27 12 56 12 85 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 Clase de vida útil [hr] P ro b a b ili d a d [- ] Media 998.6 hrs Desviación 93.9 hrs 1092.5 hrs 904.6 hrs 1186.4 hrs 810.7 hrs Media μ 1σ 1σ 2σ 2σ μ σ μ+1⋅σ μ−1⋅σ μ+2⋅σ μ−2⋅σ Contiene . ..de los datos 68.26% 95,44% μ±1⋅σ μ±2⋅σ 70 7 73 6 76 5 79 4 82 2 85 1 88 0 90 9 93 8 96 7 99 6 10 25 10 54 10 83 11 12 11 40 11 69 11 98 12 27 12 56 12 85 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 Clase de vida útil [hr] P ro b a b ili d a d [- ] PDF (x )= 1 σ √2π ⋅e − 1 2 ( x−μσ ) 2 ,−∞<x<∞ ∫ −∞ +∞ PDF (x )⋅dx=1 Función de DensidadDistribución Gaussiana – Campana de Gauss y Distribución Gaussiana ● La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales y psicológicos. ● Algunos ejemplos de variables asociadas a fenómenos naturales que siguen el modelo de la normal son: – caracteres morfológicos de individuos como la estatura – caracteres fisiológicos como el efecto de un fármaco – caracteres psicológicos como el cociente intelectual – nivel de ruido en telecomunicaciones – incertidumbre al medir ciertas magnitudes ● Se puede determinar: que tan probable es que un cierto fenómeno ocurra, aunque no se sepa muy bien porque ocurre. Función de densidad ● No permite determinar directamente la probabilidad que ocurra un cierto evento específico, sino solamente la probabilidad que ocurra un evento dentro de ciertos límites 70 7 73 6 76 5 79 4 82 2 85 1 88 0 90 9 93 8 96 7 99 6 10 25 10 54 10 83 11 12 11 40 11 69 11 98 12 27 12 56 12 85 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 Clase de vida útil [hr] P ro b a b ili d a d [- ] ∫ −∞ 1100 PDD (x )⋅dx=0.86=86% Probabilidad que se queme una ampolleta antes de 1100 horas: P=86% 700 750 800 850 900 950 1000 1050 1100 1150 1200 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Vida Útil [hrs] C D F [ -] Función de probabilidad acumulada (Función de distribución ) ● Para simplificar la determinación de la probabilidad que ocurra un cierto evento, se determina la Función de Distribución acumulada (CDF). ● Corresponde a la integración de la Función de Densidad CDF (x )=∫ −∞ x PDF (x )⋅dx Probabilidad que se queme antes de las 1100 hrs: CDF(1100) = 0.86 = 86% 700 750 800 850 900 950 1000 1050 1100 1150 1200 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Vida Útil [hrs] C D F [ -] Función de probabilidad acumulada ● Para determinar la probabilidad que ocurra un evento entre dos límites... ● … se determinan los CDF para ambos valores y se restan. Probabilidad que se queme entre las 1050 hrs y 1100 hrs P = 0.86 - 0.71 = 0.15 P =15% CDF(1050) = 0.71 CDF(1100) = 0.86 15% Estadística en MATLAB ● Función de Densidad Normal (Gauss): data = xlsread ('ampolletas.xls'); vida = data(:,2); histfit(vida); mu = mean(vida); sigma = std(vida); mini = min(vida); maxi = max(vida); x = linspace(mini,maxi,100); pdf=normpdf(x, mu, sigma); pdf_corr = pdf * 1 / sum(pdf); plot(x, pdf_corr); ● Función de Distribución Acumulada (CDF): cdf = normcdf(x, mu, sigma); plot(x, cdf); ● Cálculo de probabilidad entre límites: normcdf(1100,mu,sigma) - normcdf(1050, mu, sigma) Distribución uniforme ● Algunos eventos tienen una distribución uniforme de probabilidad: Cada evento tiene la misma probabilidad de ocurrir. ● Ejemplos: Elegir un número entre 1 y 10, Lanzar un dado, Kino PDF (x )={ 1 b−a para a≤x≤b 0 para x<a o x>b CDF (x )={ 0 para x<a x−a b−a para x∈[a ,b ) 1 para x≥b Distribución Weibull ● El modelo propuesto por Weibull se usa para modelar datos asimétricos. ● Por ejemplo en problemas relacionados con falla de materiales y estudios de confiabilidad. ● Muchos procesos técnicos se pueden aproximar con la distribución de Weibull (velocidad del viento en un lugar) ● Para estas aplicaciones, Weibull es más flexible que el modelo normal gaussiano. ● en donde k>0 es el parámetro de forma y ● λ>0 es el parámetro de escala ● *** mean, *** varianza PDF (x ; λ , k )={ k λ ( k λ ) k−1 ⋅e −( x λ ) k x⩾0 0 x<0 Distribución Weibull – Función de densidad ● El factor k influye la forma de la distribución ● Con esto se puede modelar la distribución de fallos en un sistema técnico (Ejemplo: ampolletas que se queman después de cierto tiempo de uso): – Un valor k < 1 indica que la tasa de fallos decrece con el tiempo. – Cuando k = 1, la tasa de fallos es constante en el tiempo. – Un valor k > 1 indica que la tasa de fallos crece con el tiempo. tiempo [años] p r o b a b i l i d a d Distribución Weibull ● El factor λ influye la escala en el eje “x” ● Aumentando el valor λ corresponde a un “alargamiento” de la función de densidad k = 1 λ = 100 k = 1 λ = 50 k = 1 λ = 200 p r o b a b i l i d a d tiempo Weibull – Probabilidad acumulada CDF (x )=∫ 0 x PDF (x )⋅dx=1−e −( xλ ) k 0.51 0.30 ● Determina la probabilidad que ocurra un evento antes de cierto tiempo ● Ejemplo: después de medio año de uso, un 51% de las ampolletas con k=0.5 (los que se queman mucho al principio) se han quemado, pero sólo el 30% de las ampolletas con k=1.5 (los que se queman poco al principio). ● Después de 2 años sin embargo, se invierte la situación. tiempo [años] p r o b a b i l i d a d 0.94 0.76 Weibull para medición de viento k=2.6, λ=9.5 Velocidad del viento [m/s] P ro ba b i lid ad [ - ] ● La distribución de Weibull se usa mucho para evaluar la medición de la velocidad del viento en un sitio Weibull - ¿y para qué sirve? ● Para poder procesar los datos de viento en la estimación del potencial eólico de un sitio, basta con indicar los parámetros de forma y escala de Weibull. ● Con estos dos parámetros se puede reconstruir la distribución del la velocidad del viento y determinar la energía cosechable en el sitio durante un cierto período de tiempo (1 año = 8,760 hrs). λ=4.83, k=1.60 Clase de viento Probabilidad P(v) cp [-] Energía real [MWh] 0 -1 0.08 0.40 0.1 1 - 2 0.14 0.40 3.9 2 - 3 0.16 0.40 20.2 3 - 4 0.15 0.40 53.0 4 - 5 0.13 0.40 97.7 5 - 6 0.10 0.40 143.8 …. …. …. …. E viento(v )=cp⋅ ρ 2 ⋅A⋅v viento 3 ⋅P (v )⋅ΔT Estadística en MATLAB ● Weibull: data = xlsread ('viento_semana.xls'); viento = data(:,2); param = wblfit(viento); escala = param(1); forma = param(2); ● Weibull PDF: x = linspace(min(viento), max(viento), 100); pdf = wblpdf(x, escala, forma); plot(x,pdf); ● Weibull CDF: cdf = wblcdf(x, escala, forma); plot(x,cdf); ● Cálculo de probabilidad entre límites: wblcdf(15, escala, forma) - wblcdf(190, escala, forma) TAREA #2 ● Con los datos de viento entregados en la tarea anterior: ● a) Generar diagrama Weibull de la velocidad #1 del viento para toda la semana – Determinar los factores de forma y de escala ● b) Con los datos geométricos de nuestra turbina eólica y asumiendo un factor de potencia cp constante de 0.4 (para todas las clases de viento): – Calcular la energía cosechable durante el año (se supone que el viento se comporta igual durante todo el año) 2 horas Dependencia entre dos variables ● Al medir dos variables, puede existir una dependencia entre ambas. ● Ejemplo: Se mide la velocidad del viento en dos alturas diferentes ● La velocidad del viento aumenta con la altura, pero la característica del viento es la misma ● ¿Cómo se puede determinar la relación entre una velocidad y la otra? Dependencia entre dos variables Indice de correlación ● Para determinar la dependencia directa (lineal) entre dos variables se define el índice de correlación rXY = corr(X, Y) ● Si X e Y representan dos mediciones, entonces: ● El valor del índice de correlación varía en el intervalo [-1,1] r XY= ∑ i=1 n (x i−x)(y i−y ) n⋅s x⋅s y x : media de la muestra X y : media de la muestra Y s x : desv. estándard de la muestra X s y : desv. estándard de la muestra Y n : número de muestras Indice de correlación ● r = 1: existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en proporción constante. ● 0 < r < 1: existe una correlación positiva. ● r = 0: no existe relación lineal. Pero esto no necesariamente implica que las variables son independientes: pueden existir todavía relaciones no lineales entre las dos variables. ● -1 < r < 0: existe una correlación negativa. ● r = -1: existe una correlación negativa perfecta.Indice de correlación ● Ejemplo: Medición del viento en dos alturas x (viento 1) y (viento 2) 8.8 8 2.33 9.2 8 2.93 9 8 2.63 8 7.1 0.45 7.6 6.7 0.07 7 6.2 0.07 6.7 6 0.27 6.6 5.9 0.39 7 6.1 0.10 6.1 5.7 0.92 ... ... ... (x i−x )(y i−y ) x=7.25 , y=6.60 s x=1.04 , sy=0.98 n=36 r XY= ∑ i=1 n (x i−x )(y i−y ) n⋅s x⋅s y r XY= 34.995 36.69 =0.95 Indice de correlación casi 1.0 viento 1 y viento 2 están casi perfectamente relacionados Matriz de correlación ● Muchos programas de análisis estadístico determinan la matriz de correlación en vez del índice de correlación R=[r xx r xyr yx r yy ] r xx : índice de correlación entre X y X r xy : índice de correlación entre X y Y ⋮ Generalmente nos interesa este valor Correlación lineal vs. nolineal ● Existe una relación directa (lineal) entre las dos variables ● Se puede aproximar con una recta ● Existe una relación indirecta (no-lineal) entre las dos variables ● Se debe encontrar la mejor relación entre ambas variables Función de aproximación ● El método más utilizado para encontrar la relación no-lineal entre dos variables es la aproximación de un polinómio de grado N a los datos ● El grado de polinómio puede ser máximo N = n-1 (n cantidad de datos) ● Se busca la función que mejor se aproxima a los datos, pero no necesariamente tiene que pasar exactamente por los datos ● Un grado excesivamente alto resulta en una función de aproximación que oscila entre los datos Estadística en MATLAB ● Indice de Correlación: data = xlsread ('viento_semana.xls'); viento1 = data(:,2); viento2 = data(:,3); R = corrcoef(viento1, viento2); rxy = R(1,2); ● Aproximación con polinómio: x = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]; y = [0, 0.5, 1.2, 2.5, 2.5, 5, 4, 2, 1.5, 1, 0]; n = 4; p = polyfit(x,y,n); ● Plot de polinomio x1 = linspace(0,10,100); poly = polyval(p,x1); plot(x1,poly); hold on; plot(x,y,'o'); hold off; 1 hora Función de aproximación ● Para evaluar con qué exactitud se aproximan los datos con el polinomio se puede evaluar los residuales (diferencias entre el valor del dato y el valor de la aproximación) residual i=d i=(y i−y aprox ) Función de aproximación ● Para cuantificar la calidad de aproximación se calcula la norma de los residuales ● En este ejemplo el valor de la norma es 1.8115 ● Mientras menor la norma, mejor es la aproximación a los datos ‖d‖=√ ∑i=1 n d i 2 Función de aproximación Función de aproximación ● Sin embargo, la mejor forma de evaluar la calidad de una aproximación es através del coeficiente de correlación r² ● Este valor indíca en que porcentaje representa la aproximación a los datos: 0 (no representa nada) hasta 1 (representa perfectamente) r 2=1− ∑(y i−yaprox) 2 ∑(y i−y ) 2 =1− ‖d‖ (n−1)⋅s2 r2=0.77 r2=0.87r2=0.77 Función de aproximación ● Mucho cuidado con usar la función de aproximación para extrapolar los datos!!! ● Extrapolar significa: calcular resultados fuera del rango de datos de la medición ● La función de aproximación sólo es válido en el rango para el cuál se tenía información de datos En este ejemplo: 0 - 10 zona permitida (interpolación) zona “prohibida” extrapolación Estadística en MATLAB ● Norma de residuos: d = y – polyval(p,x); nd = norm(d); ● Coeficiente de Correlación R²: r2 = 1 - sum(d.^2) / sum((y - mean(y)).^2) Incertidumbre en la medición ● Volvemos ahora a nuestro problema inicial: ● ¿Que pasa si determinamos “mal” el valor de la velocidad el viento? (incertidumbre en la medición) ● vviento = 9 m/s en vez de los 10m/s asumidos (10% de incertidumbre) ● ¡Obtenemos 23% menos de potencia debido al 10% de incertidumbre en la medición de la velocidad! ● La razón por la cual se mide con incertidumbre son dos: – Los datos de medición tienen fluctuaciones → estadística – El instrumento con el cual se mide no es perfecto A r Incertidumbre en la medición ● Para medir la velocidad del viento se utiliza un anemómetros de cazoleta o anemómetro de cuchara ● El anemómetro gira por el impacto del viento sobre las cucharas ● La velocidad de giro es proporcional a la velocidad del viento ● Se mide la velocidad de giro con un sensor magnético que detecta cada revolución de la rueda de cucharas U=A0+B0⋅F A0 : Velocidad de arranque [ m/s] B0 : Factor de amplificación [ m] F : Frecuencia de giro [ 1/s] Incertidumbre en la medición ● Del catálogo del instrumento obtenemos información sobre la calibración ● ● ● Esto resulta en una incertidumbre total de ● Esto significa que el resultado de la medición de la velocidad del viento es: A0=0.27m/s ± 0.014m/s Mejor valor Incertidumbre B0=0.6201m ± 0.027m ±1% U=(0.27m/s + 0.6201m ⋅ F )±1% Incertidumbre en la medición ● Incertidumbre relativa: wU/U = 0.01 = 1% – No usa unidades ● Incertidumbre absoluta: wU = 0.1 m/s (para U=10 m/s) – Usa unidades ● Utilizar incertidumbre absoluta: U = 10m/s ± 0.1 m/s ● Utilizar incertidumbre relativa: U = 10m/s ± 1% Incertidumbre en la medición ● El anemómetro mide entonces con una incertidumbre relativa de un 1% ● Si medimos por ejemplo una velocidad del viento de U=10m/s, tenemos que asumir que la “verdad” está entre 10m/s – 1% = 9.9m/s y 10m/s + 1% = 10.1m/s ● ¿Cómo influye esta incertidumbre de la velocidad del viento sobre el resultado que nos interesa? ● ¡La velocidad del viento va con la potencia de 3! ● ¿La incertidumbre va tambien con la potencia de 3? ¿O va tres veces? ????? Pviento=cp⋅ ρ 2 ⋅A⋅v viento 3 Propagación de incertidumbre ● La incertidumbre de cada valor medido se propaga hacia el resultado final. ● Para poder cuantificar la influencia de la incertidumbre de las mediciones se debe determinar esta propagación. ● Si “R” es el resultado que se basa en la medición de n variables xi, cada una con su incertidumbre wi, entonces: wR=√( ∂R∂ x1⋅w 1) 2 +( ∂R ∂ x 2 ⋅w 2) 2 +⋯+( ∂R ∂ xn ⋅w n) 2 R : Función para determinar el resultado de la medición ∂R ∂ x1 : Derivada parcial de la función con respecto a una variable x i : Variable de medición w i : Incertidumbre absoluta de la variable de medición Variable Descripción Valor Incertidumbre coeficiente de potencia de la turbina 0.40 densidad del aire 1.225 kg/m³ área que cubren las palas 3,850 m² velocidad del viento 10 m/s Propagación de incertidumbre ● Ejemplo: R = Pviento=cp⋅ ρ 2 ⋅A⋅v viento 3 x1 cp w cp=0.0 x 2 ρ w ρ=0.02 kg/m³ x 3 A w A=50 m² x 4 vviento w v=0.1 m/sM e di c i o ne s ∂R ∂ x1 = ∂Pviento ∂c p = ρ 2 ⋅A⋅v viento 3 ∂R ∂ x2 = ∂Pviento ∂ρ = cp 2 ⋅A⋅v viento 3 ∂R ∂ x3 = ∂Pviento ∂A =c p⋅ ρ 2 ⋅v viento 3 ∂R ∂ x4 = ∂Pviento ∂v viento =cp⋅ ρ 2 ⋅A⋅3⋅v viento 2 D e riv a d as Propagación de incertidumbre wR=√( ∂R∂ x1⋅w 1) 2 +( ∂R ∂ x2 ⋅w 2) 2 +⋯+( ∂R ∂ xn ⋅w n) 2 w Pviento=√(ρ2⋅A⋅v viento3 ⋅w c p) 2 +( cp 2 ⋅A⋅v viento 3 ⋅wρ) 2 + …√(cp⋅ρ2⋅v viento3 ⋅w A) 2 +(cp⋅ ρ 2 ⋅A⋅3⋅v viento 2 ⋅w v viento) 2 wP viento=√(1.225 kg/m³2 ⋅3,850 m²⋅103 m³/s³⋅0) 2 +(0.42 ⋅3,850⋅10 3 ⋅0.02) 2 + …√(0.4⋅1.2252 ⋅103⋅50) 2 +(0.4⋅1.2252 ⋅3,850⋅3⋅10 2 ⋅0.1) 2 Propagación de incertidumbre ● Incertidumbre total absoluta: ● Incertidumbre total relativa: w P viento=√ (0 W ) 2 + (15,400 W )2+ (12,250 W )2+ (28,297.5 W )2 w P viento=√1,187,971,006 W² w P viento=34,467W=34.5kW w p viento Pviento = w p viento cp⋅ ρ 2 ⋅A⋅v viento 3 = 34,467 W 0.4⋅1.225 kg/m³ 2 ⋅3,850 m²⋅103 m³/s³ w p viento Pviento = 34,467 W 943,250 W =0.0365=3.65% Planificación de experimento ● Al preparar y planificar un experimento se debe cuidar la selección e instalación de los instrumentos para obtener un resulado con incertidumbre mínima. ● Uno se debe preguntar: ¿Cuál de las mediciones que voy a realizar, afectará más significativamente la incertidumbre del resultado? ● Para la medición de esta magnitud se debe prestar mayor atención durante la selección del instrumento. Se debeseleccionarel instrumento que ofrece la menor incertidumbre. w P viento=√ (0 W ) 2 + (15,400 W )2+ (12,250 W )2+ (28,297.5 W )2 coeficiente de potencia densidad área velocidad Planificación de experimento ● La medición de la velocidad es la que más aporta a la incertidumbre de la potencia ● Un descuido en la medición de la velocidad resulta en un aumento de la incertidumbre final ● Al seleccionar e instalar el sensor de velocidad se debe asegurar que la incertidumbre del sensor sea mínima. Importancia Variable Aporte a la incertidumbre relativo 1 velocidad 67% 2 densidad 20% 3 área 13% 4 coeficiente 0% Resumen estadística ● Utilizando las herramientas de la estadística ahora se puede: – Analizar datos experimentales – Obtener un resultado significativo de los datos – Caracterizar la naturaleza de los datos – Crear un modelo simple – Entender la influencia de los instrumentos sobre el resultado 1 hora Slide 1 Slide 2 Slide 3 Slide 4 Slide 5 Slide 6 Slide 7 Slide 8 Slide 9 Slide 10 Slide 11 Slide 12 Slide 13 Slide 14 Slide 15 Slide 16 Slide 17 Slide 18 Slide 19 Slide 20 Slide 21 Slide 22 Slide 23 Slide 24 Slide 25 Slide 26 Slide 27 Slide 29 Slide 30 Slide 31 Slide 32 Slide 33 Slide 34 Slide 35 Slide 36 Slide 37 Slide 38 Slide 39 Slide 40 Slide 41 Slide 42 Slide 43 Slide 44 Slide 45 Slide 46 Slide 47 Slide 48 Slide 49 Slide 50 Slide 51 Slide 52 Slide 53 Slide 54 Slide 55 Slide 56 Slide 57 Slide 58 Slide 59 Slide 60 Slide 61 Slide 62 Slide 63 Slide 64 Slide 65 Slide 66 Slide 68 Slide 69 Slide 70 Slide 71 Slide 72 Slide 73 Slide 74 Slide 75 Slide 76 Slide 77 Slide 78 Slide 79
Compartir