Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Instituto Tecnológico de: :l§Q.!€a\Nlñ6És¡-eo!Qto\o€\o€¡--rF-a€-áoiaaia\aaao\aá6ááááÉÉÉÉÉÉÉÉrÉ*-i I \rl I - 80 70 60 50 40 30 20 10 0 Béja tüüd-u@U@gnúa- EElsta.d-ústü@4. Máximo Vil6n Béiar Contenido Materia pagma contenido. .................] .................. 5 PróIogo..... ................ 11 1. Conceptos básicos... ............... 15 1.1 Espacio muestral.... .......... 15 1.2 Eventos .......... 16 l.3Definiciónclásicadeprobabilidad......... .............17 1.4 Definición axiomática de probabilidad......... ....... 18 1.5 Período de retorno ...........21 1.6 Concepto de riesgo:.................. ..........22 1.7 Cálculo de la probabilidad empírica o experimental.............26 1.8 Variables a1eatorias................ -...........28 Variable aleatoria discreta ...................30 Variable aleatoria continua... ...............30 1.9 Distribuciones....... ...........31 Función de de densidad de probabilidad de una variable aleatoria discreta..... ...........32 Función de densidad de probabilidad de una variable aleatoria continua ...........33 Contenido - Página (6) Función de distribución acumulada, correspondiente a una distribución discreta" """"' 36 Función de distribución acumulada, correspondiente a una distribución continua """"'37 1.10 Valor esPerado """""""'44 1.11 Momentos de una distribución """" 40 Momento respecto al origen """"""""46 Momento ."rrruiton resiecto a la media """"""'46 Media de una distribución """""""""'41 Nlediana """""'48 Moda........ """" 48 Varianza de una distribución """""""' """""""""49 Sesgo de una distribución """"""""""49 Curtosis """""""" 50 1.12T-¡:ansfbrmaciUlllinealdevariablesaieatorias'..........,..,.,...,62 1.13 Problemas propuestos """""' """""' 65 2. Distribuciones de frecuencia de una muestra """"""13_z"|Representacióntabularygraficadelasmuestras,.,.........'.....73 Z.ZProcedimiento de cálculo' """""""""'15,3 R"p*tentación grá1irca """"""""""" 83 Histograma...........""' """"' 83 rárfgáro de frecuencia """"""" "":"""""""""""' 84 Función ¿" A"uti¿ud de probabilidad empírica ""' 85 Función¿"¿ist'iuuciónacumuladaoempírica..'................'...86 2.4 Problemas propuestos """"""" """"" 88 ,3. Medidas de las distribuciones"""""" """""""""""" 91 3'lMedidaso"scripivasdelasdistribucionesdefrecuencias...:91 ^Á 3.2 Medidas de tendencia central """""">+ La media aritmética """""' 95 La media Ponderada' oÁ Hidrologfa Estadística - página (7) La media geométrica .........97 La mediana............... .........98 La moda ......... 100 Comparación entre la media, la mediana y la moda.............. 101 3.3 Medidas de dispersión .......... ...........102 Rango....... ......L02 Yariatza... ......102 Desviación estándar.... ..... 105 Coeficientes de variación............ ....... 107 3.4 Medida de simetría y asimetría ........107 Sesgo........ ...... L07 3.5 Medida de achatamiento.......... ........ 110 Curtosis.... ...... I 10 3.6 Momentos lineales (L-moments).............:................. .......... t 17 3.7 Problemas propuestos............ .......... 133 4. Estimación de parámetros ....137 4.1 Definición de parámetros ................. 137 4.2Definición de estimadores............... .................. 138 4.3 Métodos de estimación de parámetros ............... 140 Método gráfrco ............,... 140 Método de mínimos cuadrados................ ............145 Método de momentos ............................... ........... 148 Método de máxima verosimilitud............. ........... 161 4.4 Problemas propuestos............ ..........L67 .5. Pruebas de bondad y ajuste..... ...............171 5.1 Definición............ ..........171 .5.2 Ajuste gráfico ................172 .5.3 Prueba de Chi-cuadrado........ ...........174 5.4 Prueba de Smirnov-Kolmogorov............... ........ 181 .5.5 Problemas propuestos............ ..........192 Contenido - página (8) 6. Distribüciones teóricas """" 195 6.1 Introducción......... ..........195 6.2 Distribución normal o gaussiana ""'197 6.7 Distribución log-Gumbel................ """""""""'257 6.8 Problemas propuestos...'.......... """"262 7. Correlación y regresión ..'....... """""""'267 7.1 Covarianza.......-.-.- """"'267 7.2 Correlación ............'. .......268 7.3 Medidas de correlación'.........'. """"268 7.4 Análisis de correlación..'....... """""269 7.5 Coeficiente de correlación """""""'269 7.6 Coeficiente de determinación...""""' """"""""'27O 8. Análisis de consistencia.--........ """'"""' 307 8.1 Introducción......-.. """"" 307 á.¡ ¡ráriris doble masa.............".".'....... """"""""312 Hidrologfa Estadfstica - página (9) 8.4 Análisis estadístico............... ...........314 Análisis de saltos .............315 Análisis de tendencias ............ ...........319 8.5 Problemas propuestos.............. ...,....330 9. Completación y extensión ...335 9.1 Definiciones......... ..........335 9.2Técmcas................ .........336 9.3 Proceso .........337 9.4 Criterios para mejorar los estimados de los parámetros ......341 9.5 Problemas propuestos................ ......342 '10. Generación de números aleatorios.. .....347 10.1 Generación de números aleatorios uniformemente distribuidos ............... ...........347 10.2 Generación de números aleatorios normales independientes ......... 35 1 10.3 Generación de números aleatorios log-normales independientes ........... .......... 353 10.4 Problemas propuestos........... .........355 I l. Intervalos de confianzl.......... ..............359 11.1 Estimación puntual y estimación por intervalos................ 359 ll.2lntervalo de confiatzapata la media de una distribución normal, cuya varianza es conocida............ ..............361 I1.3 Intervalo de confialzapara la media de una distribución normal, con varianza desconocida............. .............365 11.4 Intervalo de confianzaparalavaianza de la distribución normal...... ..........368 I L5 Problemas propuestos........... .........377 Bibliografía consu1tada................ ..............373 F- I l I I conr.,iiao - página (10) Anexo A. Transformada de Laplace y función gamma.......,.'.......377 A.1 Justificación ...,.,........,.,.379 A.2Latransformada de Laplace.............. .............'..380 A. 3 Ejercicios propuestos transformada de LapaIce ................. 396 A.4 Función gamma .....'......398 A.5 Ejercicios propuestos funcidn gamma ....,.........407 Anexo B: Funciones trigonométricas ........409 Apéndice: Tablas estadísticas y papeles probabilísticos .....'.........413 Otras publicaciones..., ..............435 Prólogo Los estudios hidrológicos requieren del análisis de cuantiosa información hidrometeológica; esta información puede consistir de datos de precipitación, caudales, temperatura, evaporación, etc. Los datos recopilados, solo representan una información en bruto, pero si éstos se organizan y analizan en forma adecuada, proporcionan al hidrólogo una herramienta de gran utilidad, que le permite tomar decisiones en el diseño de estructuras hidráulicas. Para el análisis de la información, la hidrología úiliza los conceptos de probabilidades y estadística, siendo este campo, una de las primeras áreas de la ciencia e ingeniería, en usar los conceptos cstadísticos, en un esfuerzo para analtzar los fenómenos naturales. La presente publicación bajo el nombre de Hidrología Estadística, 3¡tá orientada a ayudar a comprender los principios fundamentales dc la probabilidad y la estadística, aplicada ala hidrología, así como, mosffar algunas herramientas estadísticas, que han sido aplicadas gon éxito, en la solución de problemas hidrológicos. Prra la simplificación del análisis de la abundante información, se Fquiere del uso de la computadora digital, es por eso, que el autor hl desarollando la aplicación HidroEsta, que tiene la finalidad de Prccesar fácilmente esta información. Ella se utiliza en la solución d¡ los ejemplos resueltos. F Prólogo - página (12) La publicación cubre los siguientes temas: ! capitulo I, conceptos básicos,incluyendo los eventos, probabilidades, variables aleatorias, distribuciones, función densidad, función acumulada, valor esperado, momentos y transformación lineal de variables aleatorias. . capítulo II, distribuciones de frecuencia de una muestra, su representación tabular y gráfica, y su procedimiento de cálculo. . capítulo III, medidas de las distribuciones, como media, mediana, moda, medidas de dispersión, medidas de simetría y asimetría, y medidas de achatamiento, también se incluye el cálculo de los parámetros estadísticos utilizando la técnica de los momentos lineales. . capítulo IV, estimación de parámetros, mediante método gráfico, mínimos cuadrados, momentos y máxima verosimilitud. . capítulo V, pruebas de bondad de ajuste, dentro de las cuales se contemplan el ajuste gráfico, Chi-cuadrado y Smirnov- Kolmogorov. . capítulo VI, distribuciones teóricas más utilizadas en hidrología, como la normal, log-normal, gamma, log-Pearson tipo III, Gumbel y log-Gumbel. . capítulo VII, conceptos de correlación y regresión, los coeficientes de correlación y determinación, las ecuaciones de regresión lineal y no lineal simple, las ecuaciones de regresión lineal y no lineal múltiple, y la ecuación de regresión polinomial. . capítulo VIII, análisis de consistencia, como el análisis visual, doble masa, estadístico con los análisis de saltos y tendencias. Hidrología Estadística - página (13) . capítulo IX, completación y extensión de series hidrológicas, utilizando la correlación lineal, para llenar registros con valores incompletos, o para extender registros cortos, con base en otros registros mas largos. . capítulo X, técnicas de generación de números aleatorios uniformes, normales y log-normales, y de series sintéticas. . capítulo XI, la estimación de los intervalos de confianza, parala media y varianza de la población, a partir de datos muestrales. Como anexo se incluye la transformada de Laplace y la función gamma completa, conceptos matemáticos de gran importancia, que ayudan a simplificar los cálculos que se realizan en la estimación de parámetros y distribuciones teóricas. También, se incluye un listados de funciones trigonométricas, que ayudan al lector, en los ejercicios de transformada de Laplace. Por otro lado, se incluye un apéndice con las tablas estadísticas más usuales, las cuales ayudan en los cálculos a realizar, así como los papeles probabilísticos normal, log-normal, Gumbel y log-Gumbel. El autor desea expresar su agradecimiento, a aquellas personas que de una u otra manera, han estado involucradas con la elaboración de enta publicación, como por ejemplo: los estudiantes de la Escuela de ,lngeniería Agrícola, quienes utilizaron, como texto la versión proliminar de esta publicación, en el curso Estadística Aplicada, el dlscñador gráfrco, Rafael Murillo que trabajó con las ilustraciones, cl estudiante Gerardo Espinoza, por la dígitalización de parte del toxto y Alexis Rodríguez del Instituto Costarricense de Electricidad (lCE), por sus acertadas sugerencias. ,7 Prólogo - página(l4) Un agradecimiento muy especial, al Comité Regional de Recursos Hidráulicos (CRRH), por el apoyo económico, pors financiar la primera edición, y por hacer llegar el libro a todos los países de Centroamérica. Máximo Villón Béjar Conceptos básicos 1.1 Espacio muestral Es el conjunto de todos los posibles resultados de un experimento. Aún cuando en un experimento, no es posible determinar con seguridad su resultado, si se puede, definir con precisión un listado de los resultados posibles de ocurrir. Esta lista constituye el espacio muestral, y se designa como §. ffjemplos I:1 . l, Si el experimento consiste en lanzar una moneda, los resultados posibles son escudo o corona, luego el espacio muestral se representa como: S = { escudo, corona } tlonde: NS = 2 llcndo, Ng : número posible de resultados del espacio muestral 7, Si el experimento consiste enlanzar un dado, el espacio muestral será: t7 Conceptos básicos - página (16) S= t 1,2,3,4,5,61 N^s=6 3. Si el experimento consiste en lanzar 2 dados, el espacio muestral, de la suma de los resultados de los dos dados, será: S= {2,3,4,5,6,7,8,9, 10, ll,L2l N.s = l1 1.2 Eventos Son los resultados posibles que se pueden presentar enlarealización de un experimento. Es un subconjunto del espacio muesffal. Ejemplos i.2 1. En el experimento de lanzar una moneda el evento A, que salga escudo es: 4= { escudo } donde: NA= | siendo, N¿ : número posible de resultados del experimento 2. En el experimento lanzar un dado, el evento B que salga número mayor o igual que 3, es: B = {3,4,5,6} NB=4 3. En el experimento lanzar dos dados, el evento C, que salga un es: C = { (1,6), (6,1), (2,5), (5,2), (4,3), (3,4) I Hidrologfa Estadística - página (lZ ) Nc=6 L.3 Definición clásica de probabilidad La probabilidad P(AL de un evento A, en un experimento aleatorio que tiene N5 resultados igualmente posibles, y de los cuales N¿, son resultados favorables, esta dada por: pre)=+ ...(t.t) Ns \iemplos 1.3 l, Al anojar una moneda, la probabilidad de que salga escudo, es: P=! 2 Al anojar un dado, hay seis casos igualmente posibles, probabilidad de que salga un número igual o mayor que 3 es: P=!-z'63 Al anojar dos dados, hay 36 casos igualmente posibles, probabilidad de que la suma de los resultados sea 7, es: En una urna se tienen dos bolas rojas y ocho bolas negras, hallar la probabilidad que al extraer una bola, esta sea de colór rojo. la la P=9=r366 Conceptos básicos - página (18) De los 10 casos igualmente probables, en 2 casos sucederá el evento que se considera, por lo que se tendrá: El concepto clásico de probabilidad sólo se puede aplicar en experimentos en los que hay un número finito de casos igualmente posibles. Pero en la naturaleza, los principales problemas prácticos no son de este tipo. 1.4 Definición axiomática de probabilidad Sea S un espacio muestral asociado a un experimento, y A cualquier suceso de S (A subconjunto de S). Se dice que P es una función de probabilidad en el espacio muestral S, si se satisfacen los siguientes tres axiomas: 1. 0 < P(A) SI,paru todoA e ,S P(S) = I Si 47, A2,..., A¡¿ es una serie de sucesos, independientes mutuamente excluyentes, entonces: P(A1U AZU 43 U...UA¡¡) = P(AD + P(A) +... + P(A¡¿) Notá. Dos eventos, son independientes si la probabilidad ocurrencia de uno, no se ve afectada por la ocurrencia del otro, son matuamente exéluyentes, cuando la ocurrencia de imposibilita la ocurrencia del otro. De estos axiomas, se deducen los siguientes teoremas: o-2 -lI ---- 105 Hidrología Estadfstica - página (19) l. P(a)=g 2. P(IC'¡ = 1 - P(A), dohdeACes el complemento deA Los axiomas anteriores, permiten la definición de los siguientes conceptos importantes : Probabilidad de Ia unión de sucesos Si A y B son eventos cualesquiera en un espacio muestral §, entonces: . P(A U B) = P(A) + P(B) - P(A n B) ...(r.2) La P(A U B), es llamada unión de probabilidades y se lee la probabilidad deAoB. Probabilidad de eventos independientes Si A y B son eventos independientes de un espacio muestral §, cntonces: P(A a B) = P(A) x P(B) .. . (1.3) La P(A n B), es llamada Ia probabilidad de intersección y se lee probabilidadde Ay B. Probabilidad condicional §l e y B son dos eventos en los cuales probabilidad condicional de que ocrrra tucedió A, se define por: 2. 3 P(A) + 0, entonces, la el suceso B, dado que 7 Ejemplo 1.4 Supóngase que el río Turrialba alcanza cada invierno un nivel de creciente con una frecuencia relativa de 0.2. En el río Turrialba, cuando atraviesa la ciudad del mismo nombre, hay un puente cuya probabilidad de falla en los estribos es 0.3 y la experiencia muestra que cuando hay creciente, las probabilidades de esta falla suben a 0.5. Con estos datos se desea conocer la probabilidad de falla en eI puente. Solución: De acuerdo a los datos del problema, se tiene: Probabilidad ocurrencia de la creciente: P(C) = 0.2 Probabilidad no ocurrencia de la creciente: p(C) = 1-0.2 = 0.8Probabilidad falla: P(O = 0.3 Probabilidad no falla: P(F1= I - 0.3 = 0.7 Probabilidad falla dada la creciente: P(Flq =O.5 El puente falla (queda inutilizado), cuando falla en los estribos cuando hay creciente; esto se representa de acuerdo a Ia (L.2), de la siguiente forma: P(CU F)= P(A+ P(D - P(C nfl ... (1.5) De otro lado, de la ecuación (1.4) de la probabilidad condicional, tiene: P(F'tC)='(?.2,') = p(CnF) = p(c)xp(F tC)P(C) Luego: P(C o F) =O.2 x 0.5 = 0.1 Hidrología Estadística - página (21) Sustituyendo valores en la ecuación (1.5), resulta: P(CU F)=0.2+0.3 -0.1 P(CU F)=0.4 .'. La probabilidad de falla en el puente es del 40 7o. 1.5 Período de retorno (T) Se define el pertodo de retorno T, como el intervalo promedio de tiempo en años, dentro del cual un evento de magnitud x puede ser igualado o excedido, por lo menos una vez en promedio. Así, si un evento igual o mayor a -r, ocurre una vez en I años, su probabilidad de ocurrencia P, es igual a I en Tcasos, es decir: p(x > *> = l; ... (1.6) I ó If- - ...fi.7\ P(X > x) donde : P(X>x ) = probabilidad de ocurrencia de un evento >.r f = período de retorno L¡ definición anterior, permite indicar que la probabilidad de que x ll0 ocuna en cualquier año; es decir, la probabilidad de ocurrencia ,Ét un evento <.r, se expresa como: Conceptos básicos - página (20) P(BtA\-P(A.B) P(A) P(X<x)=1-P(X>-x) le: Pk <r)=t-1,T 1,-'-l- r(x<x) ...(1.8) ...(1.e) F Conceptos básicos - págirc(22) donde: I- período de retorno P(X>x) = probabilidad de excedencia P(X <x) = probabilidad de no excedencia En la tabla 1.1, se muestran los períodos de retorno recomendados, para el cálculo de caudales de diseño de estructuras menores. Tabla 1.1 Período de retorno de diseño recomendado, para estructuras menores * Puede aumentar si estas obras protegen poblados de importancia. 1.6 Concepto de Riesgo (R) Si un evento de diseño, por ejemplo un caudal de diseño Q, tiene un período de retorno de T años, y una probabilidad de excedencia P, de acuerdo al apartado anterior, se cumple: p=! T Hidrología Estadística - págha (231 donde: P - probabilidad de ocurrencia de un caudal > Q I- período de retorno La probabilidad de que Q no ocuna en cualquier año; es decir, la probabilidad de ocurrencia de un caudal < Q, es: P=L-P 1 P =l-1 T Si se supone que la no ocurrencia de un evento en un año cualquiera, es independiente de la no ocurencia del mismo, en los años anteriores y posteriores, entonces la probabilidad de que el evento no ocurra en n años sucesivos ó confiabilidad, es: P.P....P - -/- n factores La probabilidad de que el evento, oculTa al menos una vez en r¿ años sucesivos, es conocida como riesgo o falla R, y se representa por: R = 1- (P)' R=riesgoofalla I- período de retorno n = vida útil del proyecto Pn =1, - 1)'(. r) n = r-[r-+)' (1 ro) donde: Tipo de estructura Periodo de Retorno laños) Puente sobre carretera importante 50-100 Puente sobre carretera menos importante o alcantarillas sobre carretera imoortante 25 Alcantarillas sobre camino secundario 5-10 Drenaje lateralde los pavimentos, donde puede tolerarse encharcamiento con lluvia de corta duración 1-2 Drena¡e de aeropuertos 5 Drenaie urbano 2-10 Drenaie Aqrícola 5-10 Muros de encauzamiento 2-50* Alcantarillas para carreteras 1.1 -5 Conceptor básicos - p&gina (24l- Con el prrámetro riesgo, ee posiHe determinar cuáles son las implicaciones, de seleccionar un período de retorno dado de una obra, que tiene una vida útil de n años. En la tabla 1.2, se muestran algtmos valores de riesgo. Para diferentes valores de períodos de retorno (7) y diferentes valores de vida útil (n) de las obras. Tabla 1.2 Valores de R, en función de T y n T Hlesoo ffI) l,=fl) n=100 n=150 10 0.99485 0.99997 0.99999 20 0.92306 0.99408 0.99954 50 0.63583 0.86738 0.95170 100 0.39499 0.63397 0.77855 500 0.09525 0.18143 0.25940 1000 0.04879 0.09521 0.f 3936 5000 0.0099s 0.01980 0.02956 10000 0.00499 0.00995 0.01489 La probabilidad de que se presente al menos un evento de probabilidad llT en I años es: 1- (l - lfi)r, que para un peíodo largo tiende a ser 0.6321. En consecuencia, si la vida útil de una estructura y el período de retorno de diseño son iguales, la probabilidad de que la capacidad de la estructura sea excedida durante la vida útil es muy alta. Por lo tanto, el período de retorno debe rer mucho mayor que la vida útil de la estructura para estar razonablemente seguros de que ningún valor exceda su capacidad. Sin embargo, para cualquier período de retorno de diseño que se seleccione, siempre hay una probabilidad de que el valor sea excedido; por supuesto, si se selecciona un período de retorno de diseño muy alto en comparaeión con la vida útil de la estructura, la probabilidad de que su eapacidad sea excedida podrá ser muy b{a, pero siempre existe. Hidrología Estadfstica - página (25]l Despejando T de la ecuación (1.10), se tiene: l,-1)'=r-RI r] 1-:=1r-n)iT\ 1-(1-RÉ = 1 T 7 = --J , ... (l.ll)r-(r-n); En la tabla 1.3, se presentan valores de T, para diferentes valores de riesgo (R) y diferentes valores de vida úül (n) de las obras. Tabla 1.3 Valores de T, en función de R y n Ejemplo 1.5: Determinar el riesgo o años, si se diseña para falla de una obra que tiene una vida útil de 15 un período de retorno de 10 años. R Vida 2 3 5 10 25 50 100 2lJlJ 0.01 100 199 299 498 995 2488 4975 99s0 1990 0 o.o2 50 99 149 248 495 1238 2475 4950 9900 0.05 20 39 59 98 195 488 975 1 950 3900 0.10 10 19 29 48 95 238 475 950 1899 0.25 4 7 11 18 35 87 174 348 695 0.50 2 3 5 I 15 37 73 145 289 0.75 1.3 2 2.7 4.1 7.7 18 37 73 144 0.99 1.0 111 1.27 1.66 2.7 5.9 11 22 44 F Conceptos básicos - página (26) Solución: De los datos del ejemplo, se tiene: Z=10y n=15 Sustituyendo valores en la ecuación (1.10), se tiene: R=1-1,-l)" [ 10J R =0.7941=79.417o Si el riesgo es de 79.41Vo, se tiene una probabilidad del79.4lVo de que la obra falle durante su vida útil. Ejemplo 1.6: Para el diseño de una estructura hidráulica, con vida útil de 25 años, se acepta sólo el IO %o'de riesgo. ¿Qué período de retorno se debe escoger para el diseño de la estructura? Solución: De los datos del ejemplo, se tiene: T=l0Vo=0.Ly n= 25 años Sustituyendo valores en la ecuación (1.1 1), se tiene: 11T= ' =1-grno* =237'78 l-(l-o.l),5 .'.f=238años 1.7 Cálculo de la probabilidad empírica o experimental Hidrología Estadística - página (27 I XlrX2, I3r...,fN Existen varias fórmulas para calcular la probabilidad de ocurrencia "de- los datos ordenados, los cuales se muestran en la tabla 1.4. Tabla 1.4 Fórmulas para determinar la probabilidad experimental Fórmula empírica Probabilidad experimental acumulada P California m n Hazen 1m-- 2 n Weibull 'i m nll Chegadayev m-0.3 n+0.4 Blom Tukey Gringorten m-a n *7- 2a donde : P - probabilidad experimental acumulada o frecuencia relativa empírica m= nimeto de orden n = número de datos Dado un conjunto de datos ordenados: Conceptos básicos - págna (2Bl a = yalor comprendido en el intervalo O < a < l, y depende de n, de acuerdo a la siguiente tabla:amst n 10 20 30 40 50 a o.448 o.443 0.442 0.441 o.440 n 60 70 80 90 100 a 0.440 o.440 o.440 0.439 0.439 De todas estas fórmulas empíricas, la más utilizada es'la de weibull. Para calcular la probabilidad de excedencia p(x ) x), los datos se ordenan de mayor a menor, mientras que para caicular ra probabilidad de no excedencia p(x < x), los datós se ordenan de menor a mayor. L.8 Variables aleatorias una variable aleatoria,'", ,nu función x, definida sobre un espacio muestral ,s, que asigna un valor a esta variable, correspondiente a cada punto (o cada resultado) del espacio -r.rt ul de un experimento. A una variable aleatoria, se le conoce también como variable estocástica, sus valores son números reales, que no pueden predecirse con certeza antes de ocurrir el fenómeno, es decir, ocurren al azar. El comportamiento de una variable aleatoria está descrito por una ley de probabilidades, la cual asigna medidas de probabilidada posibles valores o rangos de ocurrencia de la variable aleatoria. Ejempla 1.7 sea el experimento: lanzamientos independientes de una moneda de l0yuna de2}colones. Hidrologfa Estadística - págrna (291 En este caso el espacio muestral §, consta de los cuatro puntos (resultados): (e,e), (e,c), (c,e), (c,c) donde: e = escudo, C = COfOna la primera letra, se refiere a la moneda de 10 colones y la segunda a la de 20 colones. Si se define como va¡iable aleatoria: X = número total de escudos que se obtiene al efectua¡ el experimento entonces, la variable aleatoria X, puede ser: X= 0, t,2 donde: X = 0, si el resultado son 0 escudos X= l, si el resultado es I escudo X = 2, si el resultado son 2 escudos luego, considerando que las monedas no son falsas, si: X = 0; le corresponde una probabilidad de: P(X=O) =ll4=0.25 X = l,le corresponde una probabilidad de: P(X=l) =214= ll2=0.5 X =2,1e corresponde una probabilidad de: P(X=2) = ll4 =0.25 En forma general, X puede tomar un valor cualquiera del siguiente htodo: X=a =+ a<X<b + XSc + X>d + P(X= a) P(a<X< b) P(Xsc) P(X> d) Conceptos básicos - página (30) Clases de variables aleatorias 1. Variable aleatoria discreta se dice que una variable aleatoria X es discreta, cuando sus valores se restringen a un conjunto enumerable finito o infinito. Ejemplo: si X representa el número de días de lruvias ocurridas en los meses de un año cualquiera (figura l.l), entonces X es una variable aleatoria discreta. En este caso, la ley de probabilida asocia medidas de probabilidad a cada posible ocurrencia de variable aleatoria. Número de dias de lluvia EF Meses Figura 1.1 Ejemplo de variable aleatoria discreta 2. Variable aleatoria continua Se dice que una variable aleatoria X es continua, cuando sus se encuentran en un rango continuo y puede ser representado cualquier número entero o decimal. Ejemplo: Si Q es una variable aleatoria que denota el valor de caudales promedios diarios del río corobicí (figura r.2), entonces Hidrología Estadística - página (31) C0ntinua. En este caso la ley de probabilidades asigna medidas de probabilidad a rangos de ocurrencia de la variable aleatoria. 12 Figura 1.2 Ejemplo de variable aleatoria continua o 31 muyorfa de secuencias de variables hidrológicas son series variables continuas. Sin embargo, para propósitos30 25 20 15 10 5 0 de lcos, una variable discreta puede tratarse arbitrariamente como ajustándose a una función continua, o bien, una continua discreta, dividiendo éstas en intervalos y agrupándolas en discretos. Dlstribuciones 0omportamiento de una variable aleatoria se describe mediante su de probabilidades, que a su vez se puede caracteizr de varias La más común es mediante [a distribución de liclades de la variable aleatoria. X + variable aleatoria de la función I =+ valor particular que toma la variable aleatoria flf) + l'unción de densidad (función de probabilidad, distribución de probabilidad de x) F(l) -+ llnción acumulada (función de distribución acumulada) días puede asumir cualquier valor y es entonces una variable Conceptos básicos - página (321 Función de densidad de probabilidad de una variable aleatoria discreta <1 V*i f (x,) Ejernplo 1.8 ; sea X la variable aleatoria que representa la suma de los puntos que se obtiene al lanzar dos dados, esta tiene como función di densidad de probabilidad: x-l 36 para x =2,3,4,5,G,7 13- x f (x) = 1; para x = 8,9,lo,ll,l2 Hidrologla Estadlstica - página (33 ) f(x) x36-1 23456789101112 Figura 1.3 Función de probabilidad de una variable aleatoria discreta Función de densidad de probabilidad de una variable aleatoria continua Es una función matemática que permite determinar la probabilidad, de que una variable aleatoria continua X, tome los diferentes valores x;, dentro del rango en el que está definido, y cumple con las siguientes condiciones: 0</'(x,)s1 ll*f @)a* =t p(asx( u¡=[bf{*)ax QJemplo 1.9 Sca X una variable aleatoria continua que tiene la función de densidad de probabilidad: en otros casos los diferentes valores de x. se tiene: x 2 3 4 5 6 7 I 9 10 11 12 f(x) 1136 2t36 3/36 4t36 5/36 6/36 5/36 4136 3/36 2136 1t36 su representación gráÉica se muestra en la figura 1.3. fo.rrr, - x')f(x)=j lo Conceptos básicos - página (34) ,para -1<x<1 , para cualquier otro valor de x Se pide: 1. Elaborar el gráfico de la función de densidad de probabilidad 2. CalcularP(-0.5 < x < 0.5) Solución: 1. Para elaborar el gráfico, se evalúaf(x), para valores de x, que estén en el intervalo definido por [-1,1], así se tiene: su representación gráfrca se muestra en la figura 1.4. f(x) ' Hidrología Estadística - página (35 ) l,'r¡ rrción de distribución acumulada 'ir \ t's una variable aleatoria (discreta o continua), se define la Irrrr rorr rlc distribución o función de distribución acumulada F(x), ,,nr, lr ¡rrobabilidad de que X tome cualquier valor menor o igual r¡rr' r, r's tlccir: /tr) I'(X<x) ,'r lrltr'(l(' rlctttostrar que: l't,t r'/r)=F(b)-F(a) )l 0. 0 0 0. -1 -0.8 -0.6 -0 4 -0.200.2 0 4 0.6 0.8 1 x Figura 1.4 Función de densidad de probabilidad de una variable aleatoria continua x -1 -0.8 -0.5 -o.2 0 0.2 0.5 08 1 f(x) 0 0.27 0.5625 0.72 o.75 o.72 0.562s o.27 0 2. P(-o.s< x < o5) = Il j.ro.r s(- x2)dx 7 Conceptos básicos - página (36) Función de distribución acumulada correspondiente a una distribución discreta Para el caso de una variable discreta F(x), se puede expresar como la sumatoria de los f(x), para los cuales ri es menor o igual que r, es decir: Hidrología Estadística - página (371 f(x) 1 7t8 Figura 1.5 Función acumulada de una variable discreta lfunción de distribución acumulada correspondiente a r¡na distribución continua l'irra el caso de una variable continua, F(x) se representa por: F(x)=P(X< x¡=f r1x¡Ax ... (1.1s) L;r rclación entre la función de distribución acumulada y la función F(x)=P(X<x)= Ef(x¡) xi(x ... (1.14) Ejemplo 1.10: Sea X una variable aleatoria discreta con función de probabitidades: f(o) = l. f(1) = 1. f(2\ =1 . fr3) = I8' 8' 8' 8 1. Calcular P(X<2) 2. Dibujar la función de distribución acumulada Solución: 1. p(x <2)=F(2)=ÉnO =f(0)+f(1) +f(2) x=0 P(x< 2\=!+3*1888 Pñ < 2\=! 8 2. Siguiendo el mismo proceso del punto (1), se puede determinar F(x) para los diferentes intervalos de x, así se tiene: rh'rlcnsidad de probabilidad, es: d F(x) f(x) dx l¡,'(1.13),setiene: ... (1.16) 34 x x<0 0<x<1 0<x<2 0<x<3 x>3 F(x) 0 118 418 7t8 1 Su gráfico se muestra en Ia figura 1.5. - Conceptos básicos - página (38) P(a < x < b) = F(b) - F(a) = l.'f1*¡ a^ ... (1.t7) Esto significa que la probabilidad del evento a < x 1 b, es igual al área que hay bajo la curva de la función de densidad de probabilidad f(x), enfie x = a y x = b (fi1¡ra 1.6). ab Figura 1.6 Representación de probabilidad También se cumple que, la probabilidad P(x = a) = 0, en efecto: P(x=a)=F(a)-F(a)=g es decir, que el área bajo la curva/(x) en un punto, es cero (figura r.7). Figura 1.7 Laprobabilidad en un punto es cero De esto, como F(x) es continua, se observa que las probabilidades correspondientes a los intervalos: a<x1b, a<x<b, alx<b, a1xlb (con a y b fijos, pero arbitrarios y con b > a), son todos iguales, es decir: Hidrología Estadística - página (39 ) P(a < x 3 b) = P(a < x < b) = P(a < x < b) = P(a 3 x 3 b) Esta situación es diferente para el caso de una distribución discreta. Ejemplo 1.11 : Sea X una variable aleatoria continua, que tiene la función de densidad de probabilidad: Calcular: l. La función acumulada 2. P(X <2) 3. P(0.2 <X <2.5) 4. P(X> t) 5. Dibujar la función de distribución acumulada Solución: l. Por definición: F(x) = J_f r«*¡ a* 0 rr*>= !/xx) dx + ffrr*l ¿* F(x) = lj rf*l a* rr(x)=lJt* 1x3¡ x3=_- =--u930 27 7 F(x) = { 27 2. P(x < 2) - P(0 < x < 2) = F(2) - F(0) P(x < zl=L -o 27 P(x<2)=O.2963 3. P(0.2< x < 2.5) = F(2.s) - F(0.2) p(0.2 < x <2.5) =ry -Y= a 1rS.O2s - 0.00s)27 27 27' P(0.2 <x <2.5) = 0.5784 4. P(x > 1) = I - P(xS 1) = 1 -tF(l) - F(Q)l 1P(x>l)=1-Ír-Ol P(x>1)=0.963 5. Para elaborar el sráfico de F(r) =I'n, "" dan valores a x en el intervalo [0,3], así se tiene: Hidrología Estadística - página (41) 1.2 F(x) 1 0.8 0.6 o.4 o.2 0 x Figura 1.8 Éunción acumulada de variable continua Solución por definición, para una variable aleatoria discreta , para que flx), sea una función de densidad de probabilidad, se cumple: cntonces: n L"flx)=I Conceptos básicos - página (40) La representación gráfrca de la función acumulada, se muestra en la figura 1.8. Ejemplo 1.12: Dado una variable aleatoria discreta X y n un número positivo, donde: I / / ,/ / -/ x 0 0.5 1 1.5 2 2.5 3 Flx) 0 0.00463 0.03704 0.12500 0.29630 0.57870 1 7 Conceptos básicos - página(42) x=1 n » C2x=l x=1 n ¿ \ )x=l x=1 Cl2+22+23+...+2nl=L 2Cl1+2+22+23+...*2n-11-1 ... (1.18) pero, de la propiedad de los cocientes notables, se tiene: l+2+Zz +23 +...+ 2,-t ==='-?' =2n -1 ... (1.19)t-2 -1 luego, sustituyendo (1.19) en (1.18), se tiene: 2C(2¡-l) = L .^1 2(2^ -l) Ejemplo l.l3 : Sabiendo que la variable aleatoria z, tiene la siguiente función de densidad de probabilidad: , '" f (z)= h, 2 (distribución normal estándar) psro -oo 1Z 16, comprobar queflz) es una función de densidad de probabilidad. Hidrología Estadística - página (43 ) Demostración: Para que fz) sea una función de densidad de probabilidad, se debe cumplir que: ll *f {da' =t Comprobación: 2_2z-z -^ltoo2 dz =--1-- [* " 2 d, ^12ÍI J-* 22z-z ^I¡o2 dr+ l.,-l;" 2 dz ...(1.20) (-z)2 fr_z\=] e 2 =-L,' ^l2rl ^l2fr 2 _z 2 =f(z) Por serflz) ='f(-z), se dice matemáticamente queflz), es una función Par. .'. [!_rrrtor= li rr.,0, luego de (1.20), se tiene: 2 z !I*¡<r¡or=#ff, 2 dz püt'ÍI-oo <Z<@ ... (t.2r) Conceptos básicos - página(44) Hidrología Estadística - página (45 ) ¡@ E(s(X)) = $(xX(xEx parax continua ... (1.23) Se requiere que g(x) esté definida para todo x real, para el cual flx) sea diferente de cero. Propiedades del valor esperado 1. Si g(x) = f, constante E(A = C .,(1.24) en efecto, por definición: Variable continua: Variable discreta: Haciendo: z2 Lzdz dy =Cly"-dZ=t222 +z="12y sustituyendo en (1.21), resulta: !1*¡<,t¿,=#ff"-,+=hff [1 *¡ r,r>¿r= #f y-1,-, d.y Aplicando la transformada de Laplace, resulta: .€1 )-*f {dar= ñ E(c) = I]*rf A>* ó E(C) = CJ-- f (x)d,x ó E(C) =EC(fx¡¡ E(C) = c \(fx¡) .,ffi=1 I LQQD (1o que se quería demostrar) 1.10 Valor esperado Si X es una variable aleatoria (discreta o continua), con función de densidad de probabilidad f(x), y si g(x) es otra función de X, entonces el valor esperado de S(D se define de lasiguiente forma: Pero: ll*f {ia* =t ó 2,flx¡)= I (definición de tunción densidad) E(C) = C luego: E(1) = 1 ó E(C)=C 2. E(a.g(x)) = a E(S@)) a= cte. t. E(a"g(x\ + b.h(x)) = a E(g(x)) + b E(h(x)) ... (1.2s) ... (t.26) E(1(X» = | g(x)flx) paraXdiscreta ... (1.22) Conceptosbásicos - página (46) L.L1 Momentos de una distribución Momento respecto al origen Si S(X) - XK, donde K=1,2,3,..., se define el momento k-ésimo, ¡r'¡, respecto al origen como: tl'k= E(x\ = | xKJ(x) para X discreta Hidrología Estadística - página (47 ) tty= E((x - p.f) = ) (x - p"fflñ paraXdiscreta ... (1.29) el ... (r.27) ... (1.28) momento de 1er orden respecto al origen, Variable continua: LL'l = J- xf(x) dx - lt el momento de 3er orden respecto al origen, ó lt'3 = J- *'r1*¡ a, El primer momento respecto al origen es la media ¡r Si K = 2, se tiene el momento de 2" orden respecto al origen, así: F'2= E x'f(x) ó /z=!l**2f(x) dx l.t'k= E(xK)= l_:x*f1x¡ d* p*qX continua Si K = 1, se tiene así: Variable discreta: F'l= 2x.f(x) pl=E(x)=lt Si K = 3, se tiene así: F3= L*3f(*) Momento central con respecto a la media Si S(X) - (X - ¡lf, donde K=1,2,3,..., se define el momento central k-ésimo, pk, respecto a la media p, como: tty= E((x - pÉi)= J_1f"-p)^f(x) dx paraXcontinua... (1.30) . Si K = I, se tiene el 1"'momento central: Variable discreta: Variable continua: Fr =2 (x - tt)f(x) ó rr1 = J:(x -p) f(x) dx Si ¡r1 existe debe ser igual a 0 . Si K = 2, se tiene el 2o momento central: kz =Z @ - tt),f(x) ó t 2 = l: 6 - Lt)rf(x) dx .'. El segundo momento central con respecto a la media es la varianTa, es decir: o2 =V(D = E((X - tt)2) = ttz . Si K = 3, se tiene el 3er momento central: ü3 =L @ - p)3fl*) ó p3 = J:(x -tr¿)' f(x) dx Media de una distribución El valor medio o media de una distribución p, es el esperado de la variable X o momento de ler orden con respecto al origen, proporciona una idea del lugar donde están concentrados los valores que toma la variable X, es decir: p = E(n =2 x.f(x) paruX discreta lt = E(X) = J_: x f(x) dx para X continua 7 Conceptos básicos - página (48) Mediana Si X es una variable aleatoria y F(x) su función de distribución acumulada, la solución ¡ de la ecuación: F(x) = 9'5 recibe el nombre de mediana de la variable aleatoria X (o de la distribución). Se puede representar en forma gráfica como: F(x xt mediana mediana ^/ F(x) = J', t(*) dx = 0.5 F(x)=X/(x)=0.5 Moda La moda es el valor de ocurrencia más frecuente. Así la moda de la población, es el valor de X que maximiza f(x) y que satisface la ecuación: df (x) =o v d'llD .g oaraxcontinua dx J d)cz o el valor de X asociado con: n Max f(x¡) i=1 Hidrología Estadística - página (49) Varianza de una distribución La vaianza de una distribución 02, es el segundo momento central con respecto a la media, mide la variabilidad alrededor de la media, es decir, expresa cualitativamente la dispersión que hay alrededor de la media, se representa como: d =V(X) = X(X . p)2f(x) = E((x - P)2) paraX discreta & = V(X) = J-1«. -p)2f(x)dx=E((x -t¿)2) paruXcontinua Ala raíz cuadrada positiva de la varian u,i" le llama desviación estándar y se designa Por o es decir: o = JV(x) Coeficiente de variación El coef,rciente.de variaci6n Cu, es una medida relativa de dispersión y se define como el cociente entre la desviación estándar y la media C, =!p Es una medida adimensional de la variabilidad alrededor de la media. Sesgo de una distribución EI sesgo de una distribución Y, es una medida de asimetría de las distribuciones y se representa por la siguiente relación: paraX continua paraX discreta r(x) paraX discreta Conceptos básicos - página (50) tt^ E((x - tt)3) '-ot- 03 . Si y = 0 la distribución es simétrica . Si y > 0 la distribución tiene cola en el lado derecho, o es' sesgada ala derccha. . Si y < 0 la distribución tiene cola en el lado izquierdo, o es sesgada alaizquierda' Curtosis El coef,rciente de curtosis, es una medida de achatamiento, indica el grado de llanura de la curva de la función de densidad flx), se iepresenta por la siguiente relación: l,to n(x- lt)o) o4 Ejempla 1.14: Expresar: & = E((x - P)2) en términos de E(x), E(*) Solución: o2=E((x- lt)2) = E((* -2W+ tt') = E(*) - E(ztt"x) + E(tt2) Hidrologfa Estadfstica - página (51) = E(*) - 2¡rE(x) + tt"zE(l) pero: E(x) = tt y E(l) = 1 = E(f) - 2l.rtt + tt' = E(*) - 2lt'+ lt' = E(f) - tt2 = E(f) - (E(x))' p¡ = d = V(n = E(f) - (E(x))' Ejemplo 1.15: Expresar E((x - p)3) en términos de E(x), E(*), E@3¡ Solución: E(* - tt)3) = E(x3 - 3fp + 3xp"z - ¡fi¡ = n@3) - E(3ftt") + E(3x¡t2) -E(tt3) = o(x3) - 3p"E(*) + 3¡t2E(x) - n(p3) = E(x3) - 3pE(*) + 3¡t"z¡r - ¡¡3 = E(x3) - 3ttE(f) + 2¡fi ¡4 = E((x - D, = s@3) - 3E(x)E(*) + 2(E(x))3 Ejernplo 1.16: Expresar: E((x - tt)4) entérminos de E(x), E(*),E(x3), E(A) Conceptos básicos - página(52) Hidrología Estadística - página (53 ) Solución: E((x-pt') = E(A - +ú p + 6x2p"2 - 4x¡fi + U,4) = n(A) - E@x3¡¡¡ + E(áxzpz¡ - nf+ití¡ + EQl¡ = n(A) + 4¡tE(x3¡ + 6tt2E(*) - 4¡t3o1x¡ + ¡/ = z(A) - 4¡tE@\+ 6¡t2E(*) - 4p,3p + ¡fi = z(#) - 4¡tE(x3¡ + 6¡t2E(f) - 3t 4 :. tL4= E((x-pf) = E(#) - 4E(x)EQ¡3) + 6(E(x))2E(*) - 3qzqx¡¡4 Ejemplo 1.17: sea X la variable aleatoria que representa el resultado que se obtiene ellanzat dos dados. Calcular E(x),V(x). Solución: si x = v.a. que representala suma de los valores de los dos dados, se tiene: 1. Cálculo de E(x): t1 E(x) = .2_*l\*)t=I E(x) = xf(xi + xyflx2) + x¡fl4)+ ... + x¡fxtt) a+¡ *Z*+x1+s*!*oxlE(x) =2Y +zx a 3636 36 36 36 *sx A +g* !+lox I +11x Z +n, L36 36 36 36 36 1 E(x) = * (, + 6 + 12 + 20 + 30 +42 +40 +36+ 30 + 22 +t2) Ek\=252 -7 36 E(x) =7 2. Cálculo de V(x): Del ejemplo 1.14, se tiene que: V(x) = E(*) " (E(x))" .... (1,31) CáIculo de E(f) 11 E(*) = .E-ri'f3i) l=l = xfflxt) + x22flx2) + qrfrq) + ... + xtt2flxtt) = 4x L+g* ?*rox a +25x ! +za, A* qgx I +36 36 36 36 36 36 +64x1 +St *!*100x 1+ntr?*ru+xL36 36 36 36 36 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x1l xl 2 3 4 5 6 7 8 I 10 11 12 f(xi) 1136 J36 3/36 4/36 s/36 6/36 5/36 4136 3/36 ?/36 1136 Conceptosbásicos - página (54) =!g+18 + 48 +100 + r80 + 294 + 320 + 324+ 300 + 242 + ra¿i)36' - 1956 = 54.3333 36 .'. E(xz¡ = 54.3333 Luego sustituyendo valores en (1.31), se tiene: V(x)=54.3333-72 V(x)=54.3333-49 V(x) = 5.3333 Ejempla 1.18: Sea X una variable aleatoria con función de densidad de probabilidad: (_, f (x\ =.1* "-^ Para x > o L0 para cualquier otro valor de x Calcular: . Media . Yarianza . Mediana . Moda . Coeficiente de variación . Coeficiente de sesgo . Coeficiente de curtosis . Dibujar la función densidad e indicar la posición de la media, mediana y moda E(x2) = lix'xe-- dx E(xz) =J-x3e-* dx aplicando la transformada de Laplace, se tiene: E(xz) = 3t Hidrología Estadística - página (55 ) Solución: 1) Cálculo de la media: 0 tt = E(x) =fiX*>dx +lixf(x) ax ¡r = lixf(x) dx , = I;x.xe'* dx ¡r =J-x2e-. dx aplicando la transformada de Laplace, se tiene: 2t,, -n- rt E(x) = l! =2 2) Cálculo de la varianza: V(x)= o2=E(*)-(E(x))' Conceptos básicos - Página (56) Hidrología Estadística - página (57 ) luego, sustituyendo (1.32) y (1.34) en (1.33), se tiene: o2=6-22 d=2 también: o=Ji .... (1.3s) 3) Cálculo de Ia mediana: Se debe calcular el valor de x que cumpla con la condición: Il""t«*l dx =0.5 0 J]-rt*l a*--¡f ;rx) dx + Ifrt*> a* lí(.) dx = o'5 ff..- x dx = 0.5 ... (1.36) Integrando por partes: ,=fl+ *=-xe. "-.1; fudv=uv-Jvdu .... (r.34) u=x + du=dx dv=e-XdX J y=-s-X luego: I=-xe-x-J1-e-x¡ax I=-xe-x+fe-xdx x I = -xe-x - e-x I ,0 I=-xe-x-e-x-(-0-e0¡ I=-xe-X-e-x+1 sustituyendo (1.37) en (1.36), resulta: _xe-x_e-x+1=0.5 -xe-x-e-x=-0.5 xe-x + e-1= 0.5 (x+ l)e-x=0.5 haciendo: h(x)='*1 =0.5 ex resolviendo por tanteos: ... (1.37) x h(x) x hlx) 1.00 0.7358 r.70 0.4932 0.s0 0.9098 1.65 0.5089 t.20 0.6626 t.67 0.5026 Conceptos básicos - página (58) i.30 0.6268 1.68 0.4995 1.40 0.5918 1.675 0.5010 1.50 0.5578 1.678 0.5001 1.60 0.5249 t.6785 0.5000 Como se observa de la tabla, el valor de x que hace que es 1.6785 h(x) = 9.5, el valor de la mediana es: 1.6 4) Cálculo de la moda: La moda es el valor de x que maximizaflx), y matemáticamente se debe cumplir: ü q1ñ =o y » d'!:ñ .0'úcJ'dx" de (a): qP = 4 1¡1e-x) = e-x+ x(-e-x) = e-X - xe-x= 0 .... (1.38)úc dx' de donde: e-x(l -x)=0 puesto que e-x É 0, entonces: 1-x=0 de donde, la moda es: x=1 de (b), se tiene: t!9= 41"-*1r-x)) = e-x(-r) + (l-x)(-e-x)dx' dx' d'f\*)=_e-X_e-x+xe-X t'zax para x = 1, se tiene: d'fl*)=_e-r_"-1+"-l r'2ax 4'l!4=-1.o dxz e 1o cual cumple con la condición (b) 5) Cálculo del coeficiente de variación: cv =9 ... (1.39)p Sustituyendo (1.32) y (1.35) en (1.39), se tiene: 6 Cv- u" 2 6) Cálculo del coeficiente de sesgo: Cs=y = U1 =E((x-tt)')o' o' Del eiemplo 1.15, se tiene:- t; ='n«*-t )i¡ = n@3) - 3E(x)E(*) + 2(E(x))3 Cálculo de E(x3): E(*3)= fx'fix¡dx al@ E(*3) = J;-x3xe-* dx E(*3)= rxae-* dx Hidrología Estadística - página (59 ) ... (1.40) ... (1.41) Conceptos básicos - página (60) Hidrología Estadística - página (61) aplicando transformada de Laplace, se tiene: E(x3¡ = 4t E$3¡ = 24 E(A)= li*s"-* a* aplicando transformada de Laplace, resulta: E(x4; = s r n(*4) = l2O Sustituyendo valores en (1.45), se tiene: ¡t4= l2O - 4x2x24 + 6x22x6 - 3x24 P4=24 Reemplazando valores en (1.44), resulta: f,2424o= ("rr' = T K=6 8) Dando valores a x,la función: fx) - xe-x parax > 0 .... (1.42) ... (1.44) ... (1.4s) .... (1.46) Sustituyendo (1.32), (1.34) y G.aD en (1.41), resulta: 14=24-3x2x6+2x23 tB=4 .... (1.35) Sustituyendo (1.43) y (1.35) en (1.40), resulta: 4 lc:- ("D'f Cs= oli 2 2j, CS= -l"12 2 Cs = ^,D 7) Crálculo del coeficiente de curtosis: .- _ ltq _ E((x - lt)o ),\- 4 -ool Del ejemplo 1.16, se tiene: pq= E(A) - 4E(x)E@3) + 6(E(.r))28(*) - 3¡o1x¡¡4 Cálculo de E(A): toma los sisui V x f(x) x f(x) 0.0 0.0000 3.0 0.1494 0.5 0.3033 3.5 0.1057 1.0 0.3679 4.0 0.0733 1.5 o.3347 4.5 0.0500 2.O 0.2707 5.0 0.0337 2.5 0.2052 5.5 0.0225 ploteando los pares de valores, se obtiene la figura 1.9. E(xa¡=l;*4*.-*d* Conceptos básicos - página(62) r(x) 0.4 0.3 o.2 0.1 Figura 1.9 Función de densidad de probabilidad De la figura 1.9, se observa que la función de densidad de probabilidad no es simétrica, sino que es sesgada a la derecha, en este caso, el valor de la mediana se encuentra, entre los valores de la moda y la media. l.lzTransformación lineal de las variables con mucha frecuencia, a fin de realizar simplificaciones con la funcién densidad, se requiere la transformación de la variable .aleatoria X a una nueva variable aleatoria: X*=alX+az conal*0 Se dice entonces que X* se ha obtenido a partir de X, mediante la 'transformación lineal (1.47). Se desea calcular la media ¡t,*, y la vananza ox2, de la variable X*, usando la media pr y la vaianza o2 de X. Se sabe que: tt= E(X) Hidrología Estadística - página (63 ) luego: p*=E(Xx)=E(alx+az) p*=atE(X)+E(a2) p* = atE(x) + a2E(l) , pero E(l) = t entonces: Itx=alE(X)+a2 l# = atp + aZ .... (1.49) De otro lado, de (1.47) - (1.48), se tiene: X*- p* = (a1X + a2) - @1¡t + a2) xx- P* = al(x - t't ) De donde, los k-ésimos momentos centrales se relacionan como sigue: E( lY* - p*lk) = E(la(X- p )lk) E( lx* : p*lk) = utk¿([(x - p )]k) En el caso particular, de (1.49), cuando k=2, se tiene: o*2 = E(¡ytr_ p\4 - a12o2 o*2 = ay262 .... (1.4e) Si se haóe la transformación 1.47 los parámetros de la variable X*, se calculln con las ecuaciones t.48 y t.50. Para el caso particular que: F* = 0 y o*2 - | de (1.50), se tiene: moda media I I Conceptos básicos - página(64) 1at=- o de (1.48), resulta: I 9=-ltlazo un --L o SiZ= X*, de (l-47), se tiene: /,- Z_ !x-L oo x-¡t o De lo anterior se puede manifestar que, si una variable X tiene media ¡ty vaianza 02, entonces la variable: --x-lt o tiene media 0 y varianza 1, es decir: $z = O , 02, = t A Z se le llama la variable estandarizada correspondiente a X. Ejemplo 1.19: La función de'densidad de probabilidad de la distribución normal o gaussiana es: I -'i'-l'l' f(x\= )-*ezl" ) o,l2ll con media p"y vaianzao2 Hidrología Estadística - página (65 ) Si z = (x - tt)/o, se tendrá: 1 -Lr2 f (x) = ---:.e 2o42Il ,,, n meclia Wz = O y v aianza 02 z = 1, la cual se conoce como ,'ción normal estándar. 1.L3 Problemas propuestos 1. Una presa de gravedad puede fallar por: . deslizamiento (A) ' creciente (B). por ambas Asumir que: t La probabilidad de falla por deslizamiento es dos veces la probabilidad de falla por creciente: P(A) =2 P(B). La probabilidad de falla por deslizamiento, dado que ha habido creciente, es 0.8: P(A/B) =O.8. Laprobabilidad de falla de la presa, es de 0.001: P(AUB) = 0.001 Determinar la probabilidad de que oculra un deslizamiento: P(A) Una agencia de arrendamiento de automóyiles recibe cada día de regreso O, t,2,3, 4,6 5 automóviles, con probabilidades de 1/6, 116, ll3, lll2, 116 y lll2, respectivamente. Obtener la media y v aftanza correspondientes al número de automóviles devueltos. Dos tetraedros regulares tienen las caras numeradas 1,2,3, y 4 respectivamente. Se arrojan los dos. Sea X la variable aleatoria correspondiente a la suma de las caras "hacia alriba". . ¿Cuál es el espacio muestral de X?. ¿Cuáles son las probabilidades de cada evento? 2. 3. Conceptos básicos'página (66) . ¿Cuáles son la media y la varianza de la distribución probabilística de X? 4. Una variable aleatoria X tiene como función de densidad de probabilidad Ce'x,para 0 ( X < "".. Hallar el valor de C . Calcular Ia media . Calcular lavaianza 5. Una variable aleatoria X toma los valores l, 2, 3, ó 4 con probabilidades (1+3ft)/4, (L-2k)14, (l+5kY4 y (l-6k)14, respec- tivamente. t ¿Para qué valores de k es esta una función de densidad de probabilidad? . Dibujar la función acumulada. 6. Dada una variable aleatoria X, donde la función de distribución acumulada es: Ill- r-'* para .r > o F(x) = l I L0 para .r S 0 . Hallar su función de densidad de probabilidad¡(¡) ' r Calcular P(x>Z) . Calcular P(-2<r <6) 7, Una variable aleatoria X, tiene como función de densidad de probabilidad: Hidrología Estadística - página (67 ) para l< x<2 para 2<x<3 en otros casos Una variable aleatoria X, tiene como función de densidad de probabilidad: ( lbu-u' para x2o f(x)=1 I l0 en otros casos . Hallar su función acumulada F(x) . CalcularP(j<x< j+I) Sea X una variable aleatoria, uniformemente distribuida: a 1 c < d < b,hallar P(c < x < d) 10. Dada la función de densidad de probabilidad de X: . Obtener el valor de k para el cual flx) es una función de densidad de probabilidad. 8. 9. Si Conceptos básicos - página (68) , Calcular la media y Yarianza de X . Determinar P(x S 3) . Determinar P(1 < x < 3.5) 11. Si X tiene la siguiente distribución: Calcular: ¡ La media de la distribución . Lavarianza de la distribución. 12. Si Xes la variable aleatoria que representa el resultado de arrojar dos dados, su función de densidad de probabilidad puede expresarse como: f(x) - x-l 36 13-x para x=2,3,...,6 para x=7,8,...,12 36 0 en otros casos calcular E(*3) 13. Una variable aleatoria continua X tiene la siguiente función densidad de probabilidad: ( Itx'(t-x) para 0<x<l f(x) = i [O para otro valor de x de Hidrología Estadística - página (69 ) Indicar cuál es la media de la distribución. 14. Una variable continua X, tiene como función de densidad de probabilidad: f(x) =B ,-0' , Calcular: . La media . La mediana para x > 0, 0 > 0 y fijo (es un parámetro), y cero para cualquier otro caso. 15. Si X tiene la función de densidad de probabilidad: I -rt-ll6xe a^ para ¡ > 0f(x)=i I [0 en otros casos Calcular: . La media de la distribución . La varianza de la distribución 16. Suponga que X tiene la función de densidad de probabilidad: [o.zs(t- xr) para -l< x <l f(x) = { l0 para cualquier otro valor Encontrar la media y varianza de: . Y=2X-2. Z=5X+6 17. Sea X una variable aleatoria que tiene como función de densidad de probabilidad: Conceptos básicos - página (70) .f (x) = -o-Yt -Ix 2'r 2tt u - Para x)0,Y>0 z2 rrY ¡'2' t,lt olros casos Encontrar la media y r.. , , .L (, Y=5X-2 18. Sea X Lr¡i., de probabilidad: Hallar la mediana. 19. Sea X una variable aleatoria que tiene como función de densidad de probabilidad: Determinar la mediana. Hidrología Estadística - página (71) 20. Se dice que una variable aleatoria Gamma de 2 parámetros si su probabilidad, es: v-lx'e X, tiene una distribución función de densidad de p .f (x) = 0'r(v) 0 en otros para 0(x<*,7)0,p>0 CASOS Determinar: . La media de la distribución . Lavarianza de la distribución . La moda Distribución de frecuencias de una mErestra 2.L Representación tabular y gráfica de las muestras En hidrología se trabaja con informaciones hidrometeorológicas; estas informaciones pueden consistir de datos de precipitación, caudales, temperatura, evaporación, etc. Por lo general, se cuenta solo con una muestra de los datos de esa población, es decir, nunca se puede disponer de la totalidad de los datos. Pero cuando éstos datos se organizan en forma compacta y fácil de utilizar, los hidrólogos pueden disponer de una herramienta de gran utilidad, para las decisiones a tomar. Distribución de frecuencias de una muestra - págha (74) Hidrología Estadística - púginfl 05) 2.2 Procedimiento de cáIculo A continuación se indica un procedimiento práctico, para el cálculo de las frecuencias y frecuencias acumuladas, la misma que s€ usará más adelante para eI cálculo de la distribución de probabilidades empíricas de datos agrupados en intervalos de clase: Frocedimiento: 1. Ordenar la muestra en forma creciente o decreciente: Para agllizar los cálculos resulta conveniente conta¡ con una aplicación que permita el ordenamiento de los datos. Por ejemplo, si se ordenan los datos en forma creciente, se tiene: fnÍn, x2, X3,... , fmáX ...(2.1) donde: rmín = x1 es el valor mínimo de los datos xmáx= rI{ es el valor máximo de los datos 2. Calcula¡ el rango R de la muestra: R = *máx- rmín ...(2.2) l. ,Seleccionar el número de intervalos de clase NC: N(' depende del tamaño de la muestra N. En aplicaciones de lrrrlrología el número de intervalos de clase puede estar entre 6y 25. Ycv.icvich sugiere para seleccionar NC, las siguientes relaciones trrr¡ríricas: Existenmuchasformasdeclasificarlosdatos'unamaneraútil'es dividirlo en categorías similares o clases, y luego contar el núrnero de observaciones que caen en cada categoía' lo que constituye una tabla de frecuenciai o una distribución de frecuencias' Para una muestra dada, se escoge tt ranSo R, que contenga a todos Iosvaloresdelamisma.SesubdivideRensubintervalosquese llaman intervalos de clasei los puntos medios de estos intervalos se denominanmarcasdeclase.Sedicequelosvaloresdelamuestra en cada uno de los intervalos forma wa clase (figura 2'1)' Al número de valores en una clase se llama frecuencia de la clase; su división entre el tamaño N de la muestra eslafrecuencia relativa de ciase.Estafrecuenciaconsideradacomofuncióndelasmarcasde clase,sedenominafuncióndefrecuenciasdelamuestra'ysedenota como flx). Lafuni¡A, cle frecuencias acumuladas de la muestra' se denota como F(x),Y se define como: F(x) = 2 ¡fr> t1x v xmáx x1 =xmin x2 13 {4 xI-.-/ +-f t-f intervalo marcas llmltes de clase de clase de clase Figura 2.1 Clasificación de datos, en intervalos de clase (¡r) NC = l.33lnN+ I ...(2.3) Distribución de frecuencias de una muestra - página (761 Hidrología Estadística - pá,gina (77 | Como se manifestó en el punto 4, con el artificio de dividir entre NC-t, se logra que xmín y xmáx queden centrados y representan las marcas de clase de la primera y última clase, entonces los límites de clase inferior y superior del primer intervalo de clase, son: (b) siN<30 si30<N<75 si N >75 = NC<5+ 8<NC<10 = l0<NC<30 NC _I donde: |y' = tamaño de la muestra lnN = logaritmo natural o neperiano del tamaño muestral. 4. Calcular la amplitud de cada intervalo de clase Ax, según la ecuación: Los otros límites de clase, se obtienen sumando la amplitud Lx, al límite de clase anterior. 6. Calcular las marcas de clase de cada uno de los intervalos: Las marcas de clase se obtienen del promedio de los límites de clase. Así la marca de clase del primer intervalo es: LCI1 + LCSl MCl = ...(2.7) Con el artificio realizado anteriormente la marca de clase del primer intervalo es igual al valor mínimo, de igual forma la marca de clase del último intervalo es igual al valor máximo es decir: MCI = xmín MCn = xmáx Las otras marcas de clase, se obtienen sumando la amplitud Ax, a las ¡narcas de clase anteriores. 7. Calcular la frecuencia absoluta: llsta es igual al número de observaciones, que caen dentro de cada intervalo definido por sus límites de clases respectivos, la misma (lue se obtiene por conteo, así se obtiene: LCII = xrlrin- Lxl2 LCSI =xmín * LxlZ = LCII + Lx ...(2.s) ...(2.6) ^^--*** - rmín - NC -1 ...(2.4) Al dividir el rango entre NC - 1, lo que en realidad se hace es incrementar el rango en Ax, incluyendo un intervalo más, el mismo que resulta, de agregar medio intervalo ( xlz), en cada extremo de la serie ordenada, a fin de que rnún Y xmáx sean respectivamente, las marcas de clase de la primera y última clase. Esto se aprecia en la frgtsra2.2, marca límitesde xm¡n clase fango real = xmax-xll'lln + Ax Figura 2.2 Representación del total de la muestra en intervalos de clase igualmente espaciados 5. Calcular los límites de clase de cada uno de los intervalos: Distri6o"¡6n de frecuencias de una muestra - página (78 ) fabi= ni donde: fabi= frecuencia absoluta del intervalo i ni = rlúmero de observaciones en el intervalo i 8. Calcular la frecuencia relativa/ry, de cada intervalo: Esta es iguat ¿ la frecuencia absoluta del mismo, dividido entre el número total de observaciones, es decir: Hidrología Estadística - página (791 f = función densidad empírica para el intervalo i ni = número de observaciones en el intervalo d N= número total de observaciones Ax = amplitud del intervalo de clases 11. Calcular la función de distribución acumulada empírica usando la fórmula: ... (2.12) donde: 4 = función de distribución acumulada f = función densidad empírica para el intervalo j Ax = amplitud del intervalo de clase Los valores de Fn y Fi obtenidos con las ecuaciones (2.10) y (2.12) resultan similares. Ejemplo 2.1: Dada Ia serie histórica de caudales medios anuales en m3ls (tabla 2.1), de la estación Salinar del Río Chicama (Perú), para el perfodo 1911-1980, calcule las frecuencias absolutas, relativa, acumulada, función densidad, función acumulada. Solución: 1. Ordenando los datos de la tabla 2.1, se obtiene latabla2.2. 2. Cálculo de R: De (2.2), se tiene: R=80.83 -3.14 R=77.69 ...(2.8) ...(2.e)fri= donde: ¿ = frssuencia relativa del intervalo i ni = nú¡ns¡s de observaciones en el intervalo i N = número total de observaciones 9. Calcular la frecuencia relativa acumulada Fr¡, usando la fórmula: n j ,.. (2.10) donde: Fri = ftecuencia relativa acumulada hasta el'intervalo i j = 1,2,..., i acumulación de los intervalos hasta i ni = iliÍ¡s¡t de observaciones en el intervalo i 10. Calcular lo función densidad empíricafi,para cada intervalo: Esta función según Yevjevich, se calcula usando la fórmula: fú. n. ---1= I NN ",=,frfr¡=f-ft=iá fr. fr. n. f.= lim l- l= -1 Ax-+0 A¡ Ar Lx donde: ... (z.tt) Distribución de frecuencias de una muestra - página (80 ) Tabla 2.1. Serie histórica de caudales medios anuales en m3ls del ío Chicama, estación Salinar (1911 - 1980) Año Caudal m3/s Año Caudal m3/s Año Caudal m3/s 191 1 7.91 1 935 24.58 1 959 22.88 1912 8.01 '1936 28.49 1 960 17.57 1913 13.27 1 937 10.05 1 961 14.60 1914 16.39 1 938 28.O1 1 962 31.14 1915 80.83 1 939 34.92 1 963 18.20 1916 60.08 1 940 31.36 1 964 24.69 1917 21.55 194'.1 42.74 1 965 22.99 1918 27.71 1942 12.94 1 966 11.78 1919 28.63 1 943 41 .16 1967 32.26 1920 30.27 1944 35.90 1 968 4.76 1921 33.43 1 945 33.76 1 969 12.70 1922 35.16 1 946 29.28 1 970 16.19 1 923 27.21 't947 19.17 1971 30.14 1924 15.58 1948 29.37 1972 30.57 1925 64.81 1 949 30.06 1 973 45.38 1926 51.26 1 950 9.67 1974 18.91 1927 33.48 1 951 10.42 1 975 34.99 1928 25.79 1 952 23.99 1 976 21.49 1929 25.80 1 953 42.17 1977 29.26 1 930 18.93 1 954 16.00 1 978 4,58 1 931 16.15 1 955 22.78 1 979 12.46 1932 38.30 1 956 32.69 1 980 3.14 1933 54.54 1 957 34.28 .1934 59.40 1 958 20.24 3. Cálculo de NC: De (2.3), resulta: NC = 1.33 1n70 + I NC = 6.65 Redondeando: NC =7 Hidrología Estadística - página (81) Tabla 2.2 Seriede caudales en -3/s, del río Chicama, ordenado ascendentemente 3.14 4.58 10.42 11.78 15.58 16.00 18.91 18.93 22.88 22.99 27.21 27.71 29.37 30.06 32.26 32.69 34.99 35.16 45.38 51.26 4. Cálculo de Ax: De (2.4) se obtiene: 4.76 7.91 8.01 12.46 12.70 12.92 16.15 16.19 16.39 19.77 20.24 21.49 23.99 24.58 24.69 28.01 28.49 28.63 30.14 30.27 30.57 33.43 33.48 33.76 35.90 38.30 41.16 54.54 59.40 60.08 9.67 10.05 13.27 14.60 't7.57 18.20 21.55 22.78 25.79 25.80 29.26 29.28 31.14 31.36 34.28 34.92 42.17 42.74 64.81 80,83 77.69 Lx= =12.957-l Si se quisiera redondear a fin de c¡ue los límites y las marcas de clase resulten númeroS más simples, podría ser: Lx=13 ó Lx=12. Si se escoge Ax = 13 los límites de clase superior e inferior, resultan un poco mayor y menor respectivamente qu€ si se escoge Lx = 12. Para el ejemplo se escoge Ax = 12, a fin de obtener valores ¡larecidos, al que se obtiene con el proceso computacional. .5. Cálculo de los límites de clase: l)o (2.5), el límite de clase inferior del primer intervalo sería: LCII =3.t4 - 1212= -2.86 ¡rcro físicamente los caudales nb pueden ser negativos, por lo que el nrcnor valor es 0. Distribución de frecuencias de una muestra - página (82 ) LCII =O De (2.6), se tiene: LCSL =0+12=72 Los otros límites, se calculan sumando a¡ al límite de clase que Ie antecede; los resultados se muestran en la columna 1 de la tabLa2.3' Nrrr. Cr*d" el límite de clase es negativo, su valor' por condiciones físicas será cero. 6. Cálcuio de las marcas de clase De (2.7),la marca de clase del primer intervalo es: O+12 MCI= -6 Las marcas de clase de lo§ otros'intervalos se obtienen sumando Ax a la precedente; los resultados se muestran en la columna 2 de la tabla2.3. 7. Cálc.ulo de la frecuencia absoluta A partir de los datos ordenados de la tabla 2.2, es fácil determinar el número de valores comprendidos en cada intervalo, así en el primer intervalo entre 0-12, hay g valores y así sucesivamente, los resultados se muestran en la columna 3 de la tabla2'3' 8. Cálculo de la frecuencia relativa usando la ecuación (2.9), se obtienen los valores que se muestran en la columna 4 de la tabla2.3- ¡frr¿- O¡r"*u. qo"-"oundo el límite de clase es inferior a cero, la Hidrología Estadística - página (83 ) 9. Cálculo de la función densidad empírica y la función de distribución acumulada. Usando las ecuaciones (2.1 l) y (2.12), se obtienen los valores que se muestran en las columnas 5 y 6 de latabla2.3. Tabla 2.3. Cálculo de la frecuencia relativa, absoluta, función densidad y acumulada del río Chicama, proceso manual. Número total de datos: 70 2.3 Representación gráfica Existen varias formas de representar las muestras en forma gráfica, clentro de las cuales se pueden mencionar: Histograma [Jn histograma es la representación gráfrca de las frecuencias, en Iorma de rectángulos, siendo la base de cada rectángulo el intervalo tle clase y la altura la frecuencia absoluta, fabl ó la frecuencia rclativa fr¡. lntervalo de clase (r) Marca de clase (21 Frecuenci a absoluta (3) Frecuenci a relativa (4) Función densidad (s) Función acumulad a 16t 0-12 6 I 0.1286 0.0107 0.1286 12-24 18 22 0.3143 0.0262 o.4429 24-36 30 28 0.4000 0.0333 o.8429 36-48 42 5 o.o714 0.0060 0.9143 48-60 54 3 0.04296 0.0036 0.9571 60 -72 66 2 0.0286 o.0024 0.9857 72- 84 78 1 0.0f 43 0.0012 1.0000 I Distribución de frecuencias de una muestra - página (84) En la figura 2.3, se muestra el histograma del ejemplo anterior, que se obtiene graficando las columnas (1) y (4) de latabla2.3. o.4 0.3 o.2 0.1 Hidrologla Estadística - página (85) fr o.4 0.3 o.2 0.1 -6 0 6 18 30 42 54 06 78 90 marca de clase Figura 2.4.Polígono de frecuencia de los caudales del río Chicama Función de densidad de probabilidad empírica El histograma o el polígono de frecuencia, son dependientes del tamaño del intervalo de clase y la posición del límite de clase. para evitar esta dependencia el histograma o el polígono de frecuencia puede transformarse en una función de densidad de probabilidad empírica, usando la ecuación (2.11) propuesta por yevjevich. En esta ecuación el intervalo de clase tiende a cero, con lo que el número de intervalos tiende a infinito. El gráfico es parecido al polígono de frecuencia, pero con la variante r:n la escala vertical, que se hace pequeña y la unión de los puntos se hace mediante líneas curvas. lin la figura 2.5, se muestra la función de densidad de probabilidad tlol ejemplo anterior, que se obtiene graficando las columnas (2) vs. (.5), de latabla2.3. 0 12 24 36 48 60 72 U intervalo de clase Figura 2.3. Histograma o distribución de frecuencias relativas de los caudales del ío Chicama Polígono de frecuencia Un polígono de frecuencia es la representacióngrffica de las frecuencias, se obtiene uniendo con líneas rectas, los puntos formados por las marcas de clase vs. la frecuencia absoluta o relativa. Para que el polígono alcance al eje horizontal, a ambos lados de la distribución, se le agtega un intervalo de clase con frecuencia igual a cero. En forma práctsca, un polígono de frecuencia se obtiene, uniendo con líneas rectas los puntos medios de todas las ba:ras de un histograma. En la ejemPlo anteri (4) de la tabla clase los valores -6 y 90. Distribución de frecuencias de una muestra - página (86 ) 0 035 0.030 0.025 0.020 0.015 0,010 0,005 .6 6 18 30 42 54 66 7E SO marca de clase Figura 2.5. Función de densidad de probabilidad empírica de los caudales del río Chicama Este gráfico de Ia función de densidad de probabilidad; es muy útil para comparar los resultados empíricos, con la función de densidad de probabilidad de distribuciones conocidas, como la normal, log- normal y otras. Función de distribución acumulada o empírica Permite ver el porcentaje de las observaciones que quedan por encima o por debajo de ciertos valores, con respecto al totai. El gráfico se obtiene uniendo los puntos obtenidos por las marcas de clase vs. la función acumulada. En la Figura 2.6, se muestra la función acumulada del ejemplo anterior, que se obtiene graficando las columnas (2) vs. (6) de la tabla2.3. Hidrología Estadística - página (g7) 100 0 §ir3 080 0"70 060 050 040 Ll30 020 0Í0 -6 6 18 30 42 54 66 Ig g0 marca Cc cli:sc Figura 2.6. Función de distribución acumulada de los caudales clel r'ío Chicama lin la figura 2.J se muestran los resultados, para los mismos crat.s. rrsundo el proceso computacional utilizando HidroEsta. En la tabi¿r tlc la figura 2.7,Ia frecuencia relativa y la función de densicl:rri ¡rc'urnulada se expresan en Vo. LC MEL LCS F¡eAbsoluta FreBelativa FunDensidad FunAcumulada 00 12.0 13 99 J5 39 47 38 53 98 71 97 6.0 1 7.99 29.99 41.99 53.38 65.S8 12.0 23.S9 35.99 47.98 59.98 71.97 97 12.8571 3r.4286 40.0000 7.1429 4 2857 2.8571 1.071 I 2.6200 3.3345 0.5s55 0.3573 o.2382 12 8E 44 29 84 29 sl 43 95 7l s8 57 I 22 28 5 2 00 l'r1ltrra 2.7 Ftnciónde densidad de probabilidad empírica y función , r (' u nt u lada, proceso computacional con HidroEsta *\ I I I I I f \ Distribución de frecuencias de una muestra - página (88 ) Hidrología Estadística - página (89 ) 2.4 Problemas Propuestos 1. Dada la serie histórica de caudales medios anuales río Santa que se muestran enlatabla2'4' Tabla 2.5 Caudales medios anuales del río Corobicí Tabla 2.4 Seriehistórica de caudales medios anuales del río Santa Año hidrolóoico Caudal fmslst Año hidrolóoico Caudal (m3lsl 54-55 13.35 70-71 15.06 55-56 21.90 71-72 10.20 56-57 11.13 72-73 4.85 57-58 5.22 73-74 11.77 58-59 4.40 74-75 8.41 59-60 6.70 75-76 8.57 60-61 8.55 76-77 6.10 61-62 8.12 77-78 5.33 62-63 7.86 78-79 6.68 63-64 5.3s 79-80 45.92 64-65 7.51 80-81 56.92 65-66 5.82 81-82 52.64 66-67 10.05 82-83 42.56 67-68 9.66 83-84 44.19 68-69 7.61 84-85 41.94 69-70 10.54 85-86 44.73 "n m3/s del 239.07 101.76 197.58 153.64 144.22 134.10 169.64 158.48 212.48 123.22 184.98 146.08 98.13 106.40 182,53 183.49 266.54 256.62 100.18 107.43 169.18 124.31 156.80 119.52 164.35 163.88 177 .00 193.78 128.15 101.66 145.79 207.78 95.05 132.49 't83.1 1 154.80 107.62 108.75 105.21 1 16.69 105.81 110.77 162.29 133.97 123.00 127.82 217.52 208.18 114,31 136.22 Realizar el gráfico de: . Histográma de distribución de frecuencias relativas . Polígono de frecuencias . Función densidad emPírica ' Función acumulada 2. Dada la serie histórica de caudales medios anuales .n *3/, de la estación 76-20-0l del río Corobicí, que se muestra en la tabla 2.5,realizar el gráfico de: . Histograma de distribución de frecuencias relativas , Polígono de frecuencias ' Función densidad emPírica. Función acumulada Medidas de las distribuciones 3.1 Medidas descriptivas de las distribuciones de frecuencias Para describir ciertas características de un conjunto de datos, se pueden usar números simples, llamados estadísticos. De ellos se puede obtener un conocimiento más preciso de los datos, que el que se obtiene a partir de las tablas y los gráficos. Las caracteísticas más importantes de este conjunto de datos son: Medida de tendencia central o medidas de localización Indican cual será el punto medio o localización central. En la figura 3.1 la curva A queda a la izquierda de los puntos medios de las curvas B y C,las cuales tienen la misma localizaciún central. Hidrología Estadística - página (92) Figura. 3.1 Comparación de la localización central de tres curvas Medidas de dispersión Se refiere a la forma como se encuentran esparcidas las observaciones. En Ia figura 3.2, se observa que la curva A tiene una mayor separación o dispersión que la curva B. Figura. 3.2 Comparación de la dispersión de dos curvas Medidas de simetría y asimetría Las curvas que representan los datos puntuales de un conjunto pueden ser simétricas o asimétricas. Las curvas simétricas, como la que se muestra en la figura 3.3, son las que al ttazar una línea vertical desde el pico de la curva al eje horizontal dividen su área en dos partes iguales, cada una idéntica a la otra. B Medidas de las distribuciones - página (93) Figura. 3.3 Curva simétrica Las curvas asimétricas o sesgadas, como las que se muestran en la figura 3.4, son aquellas en las cuales la distribución de frecuencia, se concentran en el extremo inferior o superior de la escala de medida sobré el eje horizontal. Los valores no se distribuyen igualmente, por lo que pueden ser sesgadas a la derecha, (curva A) o sesgadas a la izquierda (curva B) Figura 3.4 Curvas sesgadas, A: sesgo a la derecha o positivo, B: sesgo a la izquierda o negativo Medidas de achatamiento o curtosis Indican el grado de llanura de la curva. Por ejemplo en la figura 3.5, las curvas A y B tienen la misma localización central, pero difieren por el hecho que una es más puntiaguda que la otra, por 1o que tienen diferente grado de curtosis. Curva O \ Hidrologla Estadística - página (94) Figura. 3.5 Curvas con diferente curtosis De acuerdo al grado de achatamiento, las curvas pueden ser mesocúrtica (curva A, figura 3.6), leptocúrtica (curva B) y platicúrtica (curva C) B (leptocúrtica) Curva C (platicúrtica) Figura 3.6. Grados de achatamiento 3.2 Medidas de tendencia central Se define una medida de tendencia central, como un índice de localización central, empleado en la descripción de las distribuciones de frecuencias. En términos generales se tienen tres medidas: la media, la mediana y la moda- Medidas de las distribuciones - página (95) La media aritmética Dada la muestra compuesta de n datos, xL, x2, ..., xn,la media, se define como la suma algebraica de ellas, dividida entre el número de datos. Cuando se calcula la media para una población, esta se denota pof l.L, y cuando se trata de una muestra, por .r. Media aritmética de datos no agrupados Matemáticamente la media de los datos no agrupados, se representa por: f*, ,, _ i=t n _ i*, x- i-s -n donde: l¿ = media poblacional x = media muestral ri = valor i-ésimo de la muestra n = número de datos de la muestra o población Media aritmética de datos agrupados Para el caso de datos agrupados, la fórmula es: ...(3.1) K Dr' x¡ n ...(3.2) Curva A (mesocúrtica I ! I I ...(3.3) I Hidrología Estadística - página (96) donde: ' fi= frecuencia absoluta (número de observaciones) en el intervalo i ri = marca de clase del intervalo i k = número de intervalos de clase ¿ = número de observaciones de la muestra La media ponderada El promedio ponderado permite calcular un promedio que toma en cuenta la pOnderación de los datos con respecto a un factor, es un caso particular de ta fórmüla del cálculo de la media para los datos Medidas de las distribuciones - página (97) donde: P - precipitación promedio Pi = valor de la precipitación en la estación í Ai= áoeu de influencia de la estacióni n = número de estaciones Otro ejemplo del uso de la media ponderada, es el cálculo del promedio de la nota de los estudiantes en el TEC, donde para cada nota obtenida en un curso, el factor de ponderación es el número de créditos, así: donde: N = nota promedio N¡ - nota del curso i C = número de créditos del curso i ¡¿ = número de cursos La media geométrica Dada la muestra compuesta de n datos, xlt x2, ..., xn, la media geométrica se define como la raíz n-ésima, de la productoria de los datos, es decir: agrupados, su fórmula es: n )¿ xi - L¿J I i=1x, = n 2,¡, i=l donde: rp = media Ponderada ri = valor i-ésimo de la muestra .ñ = valor del factor de ponderación del i-ésimo valor de la muestra. n = número de observaciones de la muestra. La media ponderada, se utiliza por ejemplo para el cálculo de la precipitación promedio de una cuenca, donde para cada valor de precipitación de una estación, el factor de ponderación es el área, así: Hidrología Estadística - página (98) xG ...(3.5) donde: xG = media geométrica fi,*, = xl.x2.. .... . x¡ (productoria de los datos) i=l xi = i-ésimo valor de la muestra n = número de elementos de la muestra La mediana Es un valor único de un conjunto de datos que mide al elemento central en los datos. Este único elemento de los datos ordenados, es el más cercano a la mitad, o el más central en el conjunto de números. La mitad de los elementos quedan por encima de ese punto, y la otra mitad por debajo de é1. Mediana de los datos no agrupados Sean x7, x2, x3, ..., xn datos ordenados por magnitud creciente o decreciente y n el número impar de datos, la mediana (Med) es el dato situado en el centro, es decir: ...(3.6) Medidas de las distribuciones - página (99) Ejemplo 3.1: Para el conjunto de datos ordenados: 2, 5,8,14,21,1a mediana es: Med=8 Ejemplo 3.2: Para el conjunto de datos ordenados: 2, 5,8, 14,21,32, la mediana es: Med=8+14=11 ? Mediana de datos agruPados Siendo la mediana el valor de la observación central de un arreglo, y como no se conocen los valores de cada observación en datos agrupados, la mediana se suele aproximar, después de localizar el intervalo de clase de la mediana, por la siguiente ecuación: Med =x il2 + ! ilZ+t, para npat 2 Med=lrr#")**r* ...(3.2) Med= X @+l)12, PsrB n imPar si n es par, la mediana es el promedio de los números centrales, es decir: donde: Med = n= p= tu- w= Lm= ...(3.8) mediana muestral número total de elementos de la muestra suma de todas las frecuencias hasta la clase de la mediana pero sin incluirla frecuencia únicamente de la clase de Ia mediana amplitud del intervalo de clase límite inferior de la clase de la mediana Hidrología Estadística - página (100) En general la clase donde se encuentra la mediana, es aquella que tiene al elemento situado en la porción (n + l)12. La moda Es aquel valor que se repite más frecuentemente en un conjunto de datos, se denota por Mo. Ejemplo 3.3: Para el conjunto de datos: 2,3, 4, 4, 4,8,9, la moda es:' Mo=4 Pma datos agrupados en intervalos de clase, la moda, una vez determinada la clase modal, se calcula con la siguiente ecuación: Mo=L** dl * dl+ d2 donde: Mo = moda Lm= límite inferior de la clase modal dl = difercncia entre la frecuencia de la clase modal y la premodal (clase anterior) d2= üferencia enfre la frecuencia de la clase modal y la postmodal (clase siguiente) w = amplitud del intervalo de clase En general la clase modal es aquella que tiene la máxima frecuencia. Medidas de las distribuciones - página (101) Comparación entre la media,la mediana y la moda La media, la mediana y la moda de una distribución de frecuencias, son consideradas como los tres promedios más importantes. Sin embargo, no son igualmente aplicables y representativos a todas las situaciones. Como se muestra en la figura 3.7 las posiciones relativas de estas tres medidas dependen de la asimetría de la distribución. Si la distribución es simétrica (figura 3.7a), las tres medidas de tendencia central tienen valores idénticos. Si la distribución es asimétrica (figura 3.7b y 3.7c),los tres valores divergen, aunque siempre para una distribución unimodal, la moda está localizada en su punto más alto y la mediana está entre la media y la moda. media mediana moda I t simétrica (a) con sesgo a la derecha (b) con sesgo a la izquierda (c) Figura 3.7 Localizaciínde la media, mediana y moda ...(3.e) I Hidrología Estadística - página (102) 3.3 Medidas de dispersión Las medidas de dispersión o variabilidad permiten observar como se reparten o dispersan los datos a uno y otro lado del centro. Si la dispersión es poca, indica gran uniformidad de los datos en la distribución. Por el contrario, gran dispersión indica poca uniformidad. Rango Es una medida de distancia y representa la diferencia entre el mayor y el menor de los valores observados, es decir: Medidhs de las distribuciones - página (103) 02= ... (3.1 1) La vananza muestral (óP), se obtiene dividiendo la suma de cuadrados de las observaciones de los datos con respecto a la media, entre el número total de datos menos uno, es decir: I \(x' - x¡' a2 - i=lo - ---- n--l Para el cálculo computacional es siguiente forma: ){x, -i)'= ) (*i2-2ixr+*') ... (3.10) (3.12) útil expresar la sumatoria de la R=Xmáx-Xmín dondp: R = rango Xmáx = valor máximo de los datos Xmín = valor mínimo de los datos El rango o la amplitud es una manera conveniente de describir la dispersión, sin embargo, no da rnedida alguna de la dispersión entre los datos con respecto al valor central. Varianza Datos no agrupados: La yarianza poblacion al (o2 ), se define como la suma de cuadrados de las desviaciones de los datos con respecto a la media, dividida entre el número total de datos, es decir: pero: .§ E*'=nL'i ='in luego, sustituyendo (3.14) en (3.13), resulta: ){x, -i)'= )*,' -2n i' +ri' )(xr -l)' =2*,'-n i' Sustituyendo (3.15) en (3.11), se tiene: ,.. (3.13) 1 ,.. (3.14) ,.. (3.1s) = » x? -2*) *i +nx' Medidas de las distribuciones - página (105) - xi = valor de la i-ésima marca de clasex= p = media f = valor de la i-ésima frecuencia absoluta, es decir, número de datos en el intervalo i /< = número de intervalos de clase n = número total de datos Pa¡a el cálculo computacional, las ecuaciones (3.18) y (3.19), se pueden expresar como: ... (3.20) donde: 52 = varianzamuestral o 2 = varianzapoblacional - xi= valor i-ésimo de la muestra x = p = media muestral o poblacional n = número total de datos Datos agrupadés z Para el caso de datos agrupados en intervalos de clase, la varianza poblacional, se define como la suma de los cuadrados de las desviaciones de las marcas de clase con respecto a la media, por la frecuencia absoluta, dividido entre eI número total de datos, es decir: Hidrología Estadística - página (lM) -rr') ... (3.16) ... (3.17)-r'-.,'f "' =:l,ir*i'f i -"p') ,,=+(L.:r,-,;'ln_tlf=t, , ) Desviación estándar ...(3.2t) k »G, - P)'f , " i-11) n y lavariarna muestral por: k »G, -*)',f, o2 i=l n-l donde: ... (3.18) La desviación estándar, se define como la rufz cuadrada posiüva de la varianza, es decir: o =JJ (poblacional) § = Jst (muestral) (3.1e) Asf se tiene, para datos no agrupados: I Hidrología Estadística - página (106) Medidas de las distribuciones - página (tO7) Coeficiente de variación Es una medida relativa de dispersión, estándar y la media, es decir: que relaciona la desviación ... (3.28) Generalmente en Hidrología se suele trabajar con datos muestrales. 3.4 Medida de simetría y asimetría Sesgo El sesgo es el estadístico que mide Ia simetría y asimetría. o- §= ;') _2 2- f . -nxrl ... (3.22) ... (3.23) ... (3.24) ... (3.2s) ... (3.26) ... (3.27) C, ={ x siendo: lnx=p= -)*, n i=l Para datos agrupados: ,=^ff91,,-;Aijn[á,", ) siendo: tklsx =tL=;L*rr, Datos no agrupados: El sesgo (y ) para datos poblacionales, se ecuación: u34r-LI- 2o' donde: n, 2G,- PY:_1 ,12-l-L n obtiene con la siguiente ... (3.2e) ... (3.30) xi = valor de
Compartir