Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
I. S. C. y M. E. María de los Ángeles Gutiérrez García INSTITUTO TECNOLÓGICO SUPERIOR DE IRAPUATO 1 S I M U L A C I Ó N GENERACIÓN DE NÚMEROS ALEATORIOS PRUEBAS ESTADÍSTICAS DE ALEATORIEDAD PARA LOS NÚMEROS PSEUDOALEATORIOS: DE MEDIAS, DE VARI ANZA, DE INDEPENDENCIA Y DE BONDAD DE AJUSTE Estrictamente hablando, obtener sucesiones de números realmente aleatorios implica la utilización de algún fenómeno físico de naturaleza estocástica, como el arrojar una moneda al aire, el ruido de un circuito electrónico, el decaimiento de un material radioactivo, el conteo de fotones mediante detectores centelladores y, más recientemente, se han propuesto métodos menos tradicionales basados en fenómenos tales como el flujo turbulento de aire formado por el movimiento de los discos duros en una computadora y otro tipo de hardware, péndulos caóticos e incluso del tipo biométricos, pero debido a las inherentes dificultades que ofrece este enfoque, entre las que podemos mencionar los errores sistemáticos introducidos por el arreglo experimental, la nula reproducibilidad de la sucesión obtenida, así como la baja frecuencia en la generación de números aleatorios, han hecho necesaria la búsqueda de otras formas más eficientes para obtener estos números. Desde hace ya algunos años, se utilizan computadoras digitales para implementar programas a los que llamamos generadores de números pseudoaleatorios o simplemente generadores, los cuales mediante reglas deterministas y operaciones aritméticas muchas veces sencillas, producen sucesiones de números que se asemejan en un sentido limitado, a las obtenidas mediante un experimento aleatorio y que se denominan sucesiones de números pseudoaleatorios. La actual utilización de series muy grandes de números pseudoaleatorios en muchas aplicaciones, así como algunos episodios de resultados dudosos, obtenidos debido a la baja calidad de los generadores utilizados, ha fortalecido la necesidad de contar con mejores y cada vez más eficientes pruebas de la calidad. El campo de investigación de las pruebas de calidad de generadores de números pseudoaleatorios (y por supuesto, también de su implementación), es tan activo que prácticamente no hay mes en el que SIMULACIÓN I. S. C. y M. E. María de los Ángeles Gutiérrez García INSTITUTO TECNOLÓGICO SUPERIOR DE IRAPUATO 2 no se reporten en la literatura científica nuevas pruebas de calidad que utilizan una gran variedad de criterios y técnicas (teoría de la información, técnicas estadísticas, power spectrum, gambling tests, sistemas físicos, entropía, etc.). Las pruebas de calidad de los generadores de números pseudoaleatorios se pueden dividir en: Pruebas teóricas. Se realizan estudiando los algoritmos generadores de números pseudoaleatorios mediante el uso de herramientas como la teoría de números. Estos tipos de pruebas son útiles por su generalidad y están basadas en el estudio de algunas propiedades tales como la longitud del periodo de la secuencia y la uniformidad del algoritmo. Pruebas empíricas. Estas pruebas se concentran en las sucesiones de números pseudoaleatorios y sus propiedades. Son usadas para encontrar correlaciones locales no triviales presentes en las sucesiones de números pseudoaleatorios y mostrar aspectos desapercibidos en las pruebas teóricas. Pruebas de aleatoriedad Para comprobar si los números aleatorios obtenidos cumplen las propiedades deseadas de uniformidad e independencia se deben realizar una serie de pruebas. Prueba de frecuencia. Pruebas de series. Prueba de autocorrelación. Prueba de saltos. Prueba de póker. Cuando se prueba la uniformidad las hipótesis son: H0: Ri ~ U[0,1] H1: Ri ≠ U[0,1] La hipótesis nula supone que la secuencia de números obtenidos está distribuida uniformemente en el intervalo [0,1]. Prueba de frecuencia (Kolmogorov) La prueba básica a la que se debiera someter cualquier nuevo generador de números aleatorios es la de uniformidad. Existen dos métodos para realizar esta prueba: Prueba de Kolmogorv-Smirnov. Prueba de chi-cuadrado. Kolmogorov-Smirnov compara la función de distribución acumulada F(x) de la distribución uniforme con la empírica, SN(x), de la muestra de N observaciones. Por definición: F(x) = x para 0 ≤ x ≤ 1 SIMULACIÓN I. S. C. y M. E. María de los Ángeles Gutiérrez García INSTITUTO TECNOLÓGICO SUPERIOR DE IRAPUATO 3 Para una muestra de R1, R2, ...,RN la función de distribución acumulada, SN(x), está definida por: SN(x) = (número de R1, R2, ...,RN que son ≤ 1)/N D = max |F(x) - SN(x)| La forma de obtenerlo es de la siguiente manera: Se ordenan los datos de menor a mayor R(1) ≤ R(2) ≤ ... ≤ R(N) Se calcula: D+ = max 1 ≤ i ≤ N {i/N - R(N)} D- = max 1 ≤ i ≤ N {R(N) - (i-1)/N } Se obtiene D = max(D+,D-) Se compara con el valor de la tabla para un α dado. SIMULACIÓN I. S. C. y M. E. María de los Ángeles Gutiérrez García INSTITUTO TECNOLÓGICO SUPERIOR DE IRAPUATO 4 PRUEBA DE FRECUENCIA (CHI CUADRADA) Se necesita un conjunto mínimo de 50 datos generados que se organizarán en un histograma que cumpla lo siguiente: La cantidad de aleatorios esperados en cada una de las clases del histograma será de cinco datos como mínimo. Para aplicar esta prueba se necesita un conjunto de (N) aleatorios que sean calculados con el generador que se desea probar, y ejecutar los siguientes pasos: (N >= 50) 1.- Organizar los datos en un histograma (con n clases). 2.- Calcular el número de datos esperados en cada clase del histograma suponiendo aleatorios idealmente uniformes. 3.- Calcular el estadístico Chi-cero cuadrado con las diferencias entre las cantidades de aleatorios esperados (Ei) y los observados realmente (Oi) en cada una de las (n) clases del histograma, según la muestra que se inspecciona. 4.- Se establece el nivel máximo de variación del estadístico que se calcula (ji-cero) cuando los grados de libertad son iguales al número de clases menos uno; y la significación de la prueba es alfa. Estos valores se encuentran tabulados para la prueba de la Chi-cuadrada. 5.- Se compara el estadístico calculado con el máximo permitido que leyó de tablas; si es menor entonces se concluye que no hay evidencia estadística para afirmar que los aleatorios de la muestra no tienen una distribución uniforme. Si es mayor no se acepta la hipótesis de uniformidad en los aleatorios generados. ¿CÓMO PUEDO SABER SI MIS DATOS SON ALEATORIOS O NO? Muchos de nosotros obtenemos datos dando por sentado el control del proceso, es decir, que los datos son aleatorios con respecto a un objetivo; o con la sospecha de que el proceso estuvo fuera de control, es decir, los datos dan cierta indicación de no aleatoriedad. Haz las pruebas de frecuencia para datos aleatorios con los ejercicios planteados en clase.
Compartir