Logo Studenta

Aplicacion-de-la-teora-de-colas-en-la-planeacion-de-la-capacidad-de-un-equipo-de-computo-Mainframe-en-una-institucion-bancaria

¡Este material tiene más páginas!

Vista previa del material en texto

UNIVERSIDAD NACIONAL AUTÓNOMA 
 DE MÉXICO 
 
 FACULTAD DE CIENCIAS 
 
APLICACIÓN DE LA TEORIA DE COLAS EN LA 
PLANEACIÓN DE LA CAPACIDAD DE UN EQUIPO 
DE CÓMPUTO “MAINFRAME” EN UNA 
INSTITUCIÓN BANCARIA. 
 
 
 
 
 
 
 
 
T E S I S 
 
 
 QUE PARA OBTENER EL TÍTULO DE: 
 ACTUARIA 
 P R E S E N T A : 
 
 
RAQUEL ISABEL HERNÁNDEZ RAMÍREZ 
 
 
 
 
 
 
 
 
 
 
DIRECTOR DE TESIS: 
M. EN C. JOSÉ ANTONIO FLORES DÍAZ 
2011 
 
 
 
UNAM – Dirección General de Bibliotecas 
Tesis Digitales 
Restricciones de uso 
 
DERECHOS RESERVADOS © 
PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL 
 
Todo el material contenido en esta tesis esta protegido por la Ley Federal 
del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). 
El uso de imágenes, fragmentos de videos, y demás material que sea 
objeto de protección de los derechos de autor, será exclusivamente para 
fines educativos e informativos y deberá citar la fuente donde la obtuvo 
mencionando el autor o autores. Cualquier uso distinto como el lucro, 
reproducción, edición o modificación, será perseguido y sancionado por el 
respectivo titular de los Derechos de Autor. 
 
 
 
 
 
 
 
 
 
 
 
 
A LOS QUE YA SE FUERON 
Y A LOS QUE AÚN ME QUEDAN, 
¡GRACIAS POR TODO!. 
 
 
INDICE 
Introducción ...................................................................................................................................... 5 
I Conceptos de teoría de colas y su aplicación a la planeación de la capacidad ................. 9 
1.1 Introducción a la teoría de colas ............................................................................................. 9 
1.1.1 Historia de la teoría de colas .............................................................................................. 11 
1.1.2 Objetivos de la teoría de colas ........................................................................................... 12 
1.1.3 Aplicación en áreas comunes ............................................................................................ 13 
1.2 Administración de la capacidad y la planeación de la capacidad .................................. 15 
1.2.1 Almacenamiento y retención de la información .............................................................. 17 
1.2.2 Caracterización de cargas de información ...................................................................... 18 
1.2.3 Generación de reportes. ...................................................................................................... 18 
1.3 Las colas y la planeación de capacidad en los equipos “Mainframe”. .......................... 19 
1.3.1 Importancia de las líneas de espera en los equipos “Mainframe” .............................. 19 
1.3.2 Problemas de la planeación de la capacidad .................................................................. 22 
II Procesos Estocásticos .............................................................................................................. 25 
2.1 Proceso estocástico y su clasificación. Casos especiales. ............................................. 25 
2.1.1 Definición de proceso estocástico .................................................................................... 25 
2.1.1.1 Parámetro discreto y continuo ........................................................................................ 25 
2.1.1.2 Espacio de estados discretos y continuos. .................................................................. 26 
2.2 Procesos de conteo ................................................................................................................. 26 
2.3 Proceso Poisson ...................................................................................................................... 27 
2.4 Proceso de nacimiento y muerte (N-M). ............................................................................... 29 
2.4.1 Definición del proceso N-M ................................................................................................. 30 
2.4.1.1 Sistema de colas como proceso de N-M ....................................................................... 31 
2.4.1.2 Proceso Poisson de nacimiento puro ............................................................................ 31 
2.4.1.3 Soluciones a las ecuaciones diferenciales en diferencias. ....................................... 33 
2.5 Las distribuciones Poisson y exponencial ......................................................................... 36 
2.5.1 La distribución Poisson ....................................................................................................... 37 
2.5.2 La distribución exponencial ............................................................................................... 37 
2.5.2.1 Propiedades de la distribución exponencial ................................................................ 38 
2.6 Procesos de Markov ................................................................................................................ 40 
2.6.1 Estados alcanzables y cadena irreducible ....................................................................... 43 
2.6.2 Estados aperiódicos............................................................................................................. 43 
2.6.3 Estados transitorios y recurrentes .................................................................................... 43 
2.6.4Estados comunicados .......................................................................................................... 44 
 
 
 
 
2.6.5 Distribución estacionaria y distribución límite. .............................................................. 46 
2.6.6 Estados ergódicos ................................................................................................................ 46 
III Estructura de los sistemas de colas ...................................................................................... 50 
3.1 Elementos de un sistema de colas ....................................................................................... 50 
3.1.1 Fuente o población ............................................................................................................... 50 
3.1.2 Patrón de arribo .................................................................................................................... 50 
3.1.3 Distribución del tiempo de servicio o atención............................................................... 51 
3.1.4 Capacidad máxima de un sistema de colas ..................................................................... 52 
3.1.5 Número de servidores.......................................................................................................... 52 
3.1.6 Disciplina de colas ............................................................................................................... 53 
3.2 Notación de Kendall ................................................................................................................ 53 
3.3 Medidas de rendimiento ......................................................................................................... 54 
3.3.1 Intensidad de tráfico ............................................................................................................ 55 
3.3.2 Utilización del servidor ( ) ............................................................................................... 55 
3.3.3 Otras medidas importantes ................................................................................................ 56 
3.4 Fórmulas de Little .................................................................................................................... 56 
3.5 Relaciones importantes entre variables aleatorias usadas en teoríade colas ............ 57 
IV Modelos de teoría de colas ...................................................................................................... 59 
4.1 Clasificación de modelos ....................................................................................................... 59 
4.2 Modelos de teoría de colas basados en procesos de N-M ............................................... 59 
4.2.1 Sistemas con llegadas Poisson y servicio exponencial ................................................ 60 
4.2.1.1 Modelo M/M/1...................................................................................................................... 60 
4.2.1.2 Modelo M/M/1/K .................................................................................................................. 62 
4.2.1.3 Modelo M/M/c...................................................................................................................... 64 
4.2.1.4 Modelo M/M/c/c .................................................................................................................. 67 
4.2.1.5 Modelo M/M/ ......................................................................................................... 68 
4.3 Modelos de teoría de colas de cadena de Markov embebida. ......................................... 69 
4.3.1 Sistemas con llegadas no Poisson o servicio no exponencial .................................... 69 
4.3.1.1 Modelo M/G/1 ...................................................................................................................... 69 
4.4 Modelos de teoría de colas para sistemas computacionales reales .............................. 80 
4.4.1.1 Modelo M/G/1 (processor-sharing) ................................................................................. 81 
IV Caso de aplicación .................................................................................................................... 84 
5.1 Antecedentes del estudio. ...................................................................................................... 84 
5.2 Planteamientos del problema. ............................................................................................... 86 
5.2.1 Resultados del plan de capacidad realizada por la institución bancaria ................... 86 
5.2.2 Resultados del plan de capacidad propuesto basado en teoría de colas ................ 102 
 
 
 
 
VI Conclusiones............................................................................................................................ 149 
6.1 Metodología tradicional vs. teoría de colas ...................................................................... 149 
6.2 Conclusiones .......................................................................................................................... 151 
Referencias.................................................................................................................................... 153 
Glosario de términos ................................................................................................................... 155 
ANEXO I. ........................................................................................................................................ 160 
TABLA RESUMEN TRANSACCIONAL ...................................................................................... 160 
 
 Introducción 5 
 
 
 
Introducción 
 
 
La tecnología en México es hoy en día vista como un elemento esencial de la 
productividad y es uno de los más claros habilitadores económicos del país. Es por eso 
que para la industria de las Tecnologías de la Información (TI), ofrecer servicios de 
cómputo de calidad, es una tarea primordial para hacer frente a las necesidades de 
transformación operativa de cualquier negocio. 
 
Particularmente en el ámbito financiero, la demanda por un cómputo transaccional que 
sea seguro, eficiente y capaz de dar respuesta en tiempo y forma a las exigencias de 
clientes e inversionistas, obliga a mantener en óptimas condiciones los equipos bajo 
operación. 
 
En los últimos 30 años, la industria bancaria ha sufrido modificaciones importantes. La 
competitividad es primordial y para ello, la mayoría de las entidades financieras y 
algunas gubernamentales del país, se apoyan tecnológicamente en equipos muy 
grandes llamados “Mainframes”1, capaces de procesar grandes volúmenes de 
información, calculados en millones de instrucciones por segundo, con áreas de 
almacenamiento dimensionadas en “giga”, “tera” o incluso, “petabytes”, así como, 
procesamiento que no rebasa los segundos y milisegundos de tiempo de respuesta2. 
 
La complejidad de estos ambientes, hace de la administración de los centros de 
cómputo, una actividad fundamental en estas organizaciones; algunas de sus tareas se 
realizan de manera ocasional (pero no por ello resultan menos estratégicas), como es el 
caso de la planeación de la capacidad, con la que se garantiza el cumplimiento de 
objetivos de servicio tales como la calidad, volumen de proceso y tiempo de respuesta, 
haciendo que los recursos del sistema se encuentren siempre disponibles para prevenir 
impactos en el desempeño y continuidad de las aplicaciones críticas del negocio, aún 
ante cambios en su procesamiento y configuración. 
 
 
1
 Los términos que aparecen en letra itálica -sólo la primera vez, posteriormente en letra normal-, son en su 
mayoría descritos en el glosario; otros, son explicados bajo el contexto y desarrollo del documento. Los 
términos técnicos computacionales en inglés aparecerán entrecomillados. 
 
2 Tiempo de respuesta (“time around”) = tiempo de espera + tiempo de servicio. Los tiempos de respuesta 
pueden ser medidos como de proceso interno o bien, de usuario final (llamados “end-to-end”). Ver más 
adelante. 
 
 Introducción 6 
 
 
En la mayoría de los centros de cómputo, la planeación de la capacidad es realizada 
una o dos veces al año y casi siempre obedece a cambios previstos tales como la 
incorporación de nuevas aplicaciones o la renovación y/o sustitución de tecnología 
(“software”, “hardware” y aplicativos). 
 
A diferencia de la administración del desempeño, que vigila el cumplimiento diario de 
niveles de servicio relacionados con tiempos de respuesta o volumen de trabajo y 
reajusta la distribución de los recursos para el cumplimiento de estos niveles, pero sin 
considerar la incorporación de nueva capacidad, la planeación de la capacidad implica 
casi siempre un cambio y redimensionamiento del equipo, crecimiento -o decremento, 
según el caso- en la capacidad de procesamiento y por lo tanto, una inversión laboral y 
económica para lograrlo. 
 
Los estudios prácticos de planeación de la capacidad que hoy en día desarrollan la 
mayoría de las instalaciones, basan sus resultados generalmente en la experiencia de 
quienes los realizan o en “reglas de dedo” que resultan arbitrarias y en cierto sentido, 
frágiles, pues en la mayoría de las ocasiones no se cuestiona su razón de ser. Esto 
conlleva a generar estimaciones de capacidad inadecuadas, lo que a su vez se traduce 
en malas inversiones, tanto para nuevas adquisiciones como para crecimientos 
(“upgrades” ) de los equipos. 
 
Puesto que estas decisiones son generalmente muy costosas, con frecuencia se sacrifica 
la calidad del servicio en aras de disminuir los gastos de inversión. Al no tener 
argumentos para rebatir estas acciones, se adquieren equipos con menores 
dimensiones, lo que repercute en el desempeño de los servicios, deteriora la imagen y 
la economía de las organizaciones, y al final resulta más caro, en términos de su 
recuperación. 
 
Una de las áreas más fructíferas de la teoría de la probabilidad aplicada es el estudio de 
fenómenos de líneas de espera o colas. Cuando el proceso que realiza un equipo puede 
modelarse comoun sistema de líneas de espera, y se ajusta a un modelo de teoría de 
colas, puede proyectarse el desempeño futuro de un equipo según los requerimientos de 
tiempo de respuesta o volumen de proceso esperado, y garantizarse de esta manera, 
un buen servicio sin generar costos excesivos para su cumplimiento. 
 
 
 
 Introducción 7 
 
 
Objetivo 
 
El propósito de esta tesis es presentar una alternativa a los métodos utilizados para 
efectuar planeación de la capacidad en grandes instituciones financieras como son los 
bancos y en general, por ser una visión de amplio espectro, en organizaciones con 
grandes demandas de procesamiento y cuyos estudios resultan poco confiables pues 
carecen de sustento. Para ello, se propone el uso de métodos basados en estructuras 
más robustas, soportados en disciplinas como la matemática y concretamente, en la 
teoría de colas para llevar a cabo su análisis y finalmente, la toma de decisiones que 
implicará un desempeño conforme a los objetivos buscados de operación. 
 
Estructura de la tesis 
 
 
El primer capítulo contempla una breve introducción al estudio de colas o líneas de 
espera y su aplicación a problemas de capacidad en los equipos de cómputo. Se 
introducen conceptos de administración y planeación de capacidad y la problemática 
general que enfrentan las organizaciones al realizar planes de capacidad. Se focaliza el 
problema hacia los equipos “Mainframe”, por ser objeto de interés para el estudio de un 
caso práctico que se describe al final del documento. 
 
En el segundo capítulo, se revisan conceptos relacionados con los procesos 
estocásticos: su definición, los procesos de conteo, el proceso Poisson -este último, 
visto como caso particular de los procesos de nacimiento y muerte- y la aplicación de 
éstos para el estudio de líneas de espera; la importancia de la distribución Poisson y 
exponencial para el estudio de los tiempos de interarribo y servicio en un sistema de 
colas; los procesos de Markov y su clasificación; se revisan particularmente las cadenas 
de Markov, por sus características y su contribución al desarrollo de modelos de líneas 
de espera. 
 
El tercer capítulo describe la estructura de los sistemas de colas, la notación de 
Kendall, las leyes de Little y todas las medidas de desempeño así como su aplicación 
práctica para el entendimiento de algunos problemas reales relacionados con los 
procesos de servicio. 
 
 
 Introducción 8 
 
En el cuarto capítulo, se revisan algunos modelos basados en procesos de nacimiento y 
muerte, tal como los modelos M/M/1, M/M/c y sus variaciones en torno a la llegada y 
atención de usuarios, lo que da origen a otros modelos; algunos más, con distribuciones 
no exponenciales y entradas no Poisson, son también analizados haciendo énfasis en el 
modelo tipo GI/G/c que resulta útil para el caso de estudio propuesto. Brevemente se 
revisan algunos temas adicionales que dan apoyo y sustento a estos modelos y en sí, a 
la metodología propuesta, con el objeto de generar mejores prácticas para el desarrollo 
de planes de capacidad. 
 
Finalmente, en el capítulo cinco, haciendo uso de los elementos antes descritos, se 
comparan los resultados obtenidos bajo un estudio real de planeación de la capacidad 
realizado durante el 2004 para un equipo “Mainframe”, conforme a la metodología 
“tradicional” utilizada por personal de un banco, con los obtenidos durante el desarrollo 
de esta tesis, usando una metodología sustentada en la teoría de colas para propósitos 
de proyección de la capacidad del mismo equipo. 
 
Se muestran los beneficios obtenidos y las ventajas del uso de esta última, en el 
capítulo de conclusiones. 
 
 Capítulo I. Conceptos de Teoría de Colas y su aplicación a la Planeación de la Capacidad 9 
 
 
I Conceptos de teoría de colas y su aplicación a la planeación de la 
capacidad 
 
1.1 Introducción a la teoría de colas 
 
Algunas definiciones simples relacionadas con los sistemas de colas son las siguientes: 
 
Definición 1: De una manera básica, un sistema de colas puede ser escrito como: “los 
usuarios –entiéndase por esto una entidad cualquiera que recibe atención, no sólo seres 
humanos o trabajos- que arriban a un entorno para ser servidos, y si no son servidos 
inmediatamente, esperan por el servicio, y dejan el sistema una vez que han sido 
atendidos (algunos de éstos pueden desertar antes de recibir atención)” [3]. 
 
 Definición 2: Un cola o línea de espera, involucra objetos o entes (denominados 
usuarios), que esperan ser atendidos por un proveedor que otorga el servicio que éstos 
procuran [3]. 
 
Definición 3: “Los sistemas de colas son modelos de sistemas que proporcionan servicio. 
Como modelo, pueden representar cualquier sistema en donde los trabajos o clientes 
llegan buscando un servicio de algún tipo y salen después de que han sido atendidos” 
[19]. 
 
En cualquiera de los casos, es claro que una cola surge cuando la oferta –quien otorga 
la atención-, es menor a la demanda -los usuarios que la requieren-. Una facilidad de 
servicio es una entidad capaz de proporcionar la asistencia esperada por un cliente. Si 
el o los servidores se encuentran ocupados, el cliente entrará a la cola en el momento 
que alguno de éstos se encuentre libre. 
 
Cuando un cliente ha esperado por un tiempo considerable, su “paciencia” dependerá 
del tipo de servicio específico que desea recibir; es posible que comience a saltar de filas 
(si eso es permitido) o quizá en algún momento, decida abandonar el sistema si su 
necesidad no es prioritaria [3]. También es posible que nunca entre al medio, si éste no 
cuenta con capacidad para manejar la espera (buffers o espacios temporales de 
almacenamiento, etc.) y todos los servidores se encuentran ocupados. 
 
 Capítulo I. Conceptos de Teoría de Colas y su aplicación a la Planeación de la Capacidad 10 
 
 
Existe una gran variedad de formas en que los fenómenos de atención de usuarios se 
presentan y en ese sentido, la teoría de colas formula un número similar de modelos 
que ayudan a su comprensión. 
 
Un modelo de colas básico, puede representarse de la siguiente forma: 
 
 
 
 
 
 
 
 
 
En los ambientes donde el sistema de servicios es de amplia capacidad, difícilmente se 
forma una cola, pero muy probablemente se tendrán fracciones de tiempo en que éste 
se encontrará desocupado (“idle”). 
 
La teoría de colas es el estudio matemático del comportamiento de líneas de espera. 
Esta se presenta, cuando los "clientes" llegan a un "lugar" demandando un servicio a un 
"servidor", el cual tiene una cierta capacidad de atención. Si el servidor no está 
disponible inmediatamente y el cliente decide esperar, entonces se forma la línea de 
espera [19]. 
 
Por lo tanto, la teoría de colas permite describir, modelar, interpretar y predecir el 
fenómeno de atención de usuarios (clientes), a efecto de poder planear y anticipar 
posibles dificultades al incrementar la población que requiere atención -generando 
limitaciones en capacidad- o bien, al disminuir la población -propiciando desperdicio 
de capacidad-. 
 
La teoría de colas resulta apropiada para explicar muchos fenómenos relacionados con 
problemas de cómputo y procesamiento; es particularmente útil para cuestiones de 
predicción sobre la capacidad que deberá tener un equipo para soportar cierto volumen 
de proceso [2]. 
 
http://www.monografias.com/trabajos16/comportamiento-humano/comportamiento-humano.shtml
http://www.monografias.com/trabajos12/rete/rete.shtml
http://www.monografias.com/trabajos14/deficitsuperavit/deficitsuperavit.shtml
http://www.monografias.com/trabajos11/sercli/sercli.shtml
 
 Capítulo I. Conceptos de Teoría de Colas y su aplicación a la Planeación de la Capacidad 11 
 
 
La caracterización de los fenómenos representados por sistemas de colastiene una base 
fundamentada en el tiempo. Puesto que éste es un factor muy importante para su 
análisis, el nivel de servicio o rendimiento actual como también su desempeño futuro, 
tendrán esta misma base. 
 
Sus modelos pueden ser sencillos, pero también pueden ser combinados, dando origen 
a modelos más complejos, llamados de “redes de colas” (“networking queue models”) -
como el utilizado para explicar cómo se lleva a cabo el procesamiento bajo un equipo 
“Mainframe”-. Éstos consideran la salida de un sistema de colas como el inicio de otro y 
así, sucesivamente, ligando unos con otros de forma que expliquen el todo, formado por 
las partes. Esta simplificación puede ayudar a entender la complejidad del entorno y 
predecir confiablemente la capacidad de un servidor y sus componentes en temas 
relacionados con el servicio. 
1.1.1 Historia de la teoría de colas 
 
La teoría de colas fue desarrollada para proveer modelos que permitieran predecir el 
comportamiento de los sistemas que otorgan servicio a demandas cuya llegada es 
aleatoria. Dentro de estos problemas, “los primeros estudios que se realizaron fueron 
los sistemas de congestionamiento telefónico” [26]. 
 
Un pionero de esta investigación fue el matemático danés, Anger Krarup Erlang, quien 
en 1909 publicó su libro “The Theory of Probabilities and Telephone Conversation” [26]. 
En este estudio y en posteriores que realizó, se observa que un sistema de telefonía 
podía estar generalmente caracterizado por los siguientes aspectos: 
 
1) un sistema de entrada Poisson, con tiempos de espera por servicio de tipo 
exponencial, 
 ó 
2) un sistema de entrada Poisson, con tiempos de espera por servicio de tipo 
constante y un simple canal. 
 
Erlang es responsable también de la noción de equilibrio estacionario y de la 
introducción a las llamadas ecuaciones de balance, así como de las primeras 
consideraciones sobre la optimización de un sistema de colas [26]. 
 
 
 
 Capítulo I. Conceptos de Teoría de Colas y su aplicación a la Planeación de la Capacidad 12 
 
 
El trabajo aplicado sobre la teoría de la telefonía continuó después de Erlang. En 1927 
otro investigador, Molina [22], publicó su libro “Application of the Theory of Probability to 
Telephone Trunking Problems”; Thornton Fry [6], un año después, desarrolló y publicó 
muchos de los conceptos de los primeros trabajos de Erlang a través de su documento 
“Probability and its Engineering uses”. 
 
En los años treinta, Pollaczek [26] realizó varios trabajos pioneros sobre los procesos de 
entrada Poisson, salidas arbitrarias y problemas de simple o múltiples canales de 
proceso. Otros trabajos de igual importancia fueron desarrollados en Rusia, bajo el 
esfuerzo de Kolmogorov y Khintchine, así como, en Francia por Crommelin y en Suecia 
por Palm [26]. 
 
Los primeros trabajos en teoría de colas tuvieron un momento de gran auge, y 
posteriormente decayeron de manera significativa, hasta que en 1950 volvió a retomar 
su importancia, continuando con un desarrollo sostenido hasta la actualidad. 
 
Si bien es cierto que el propósito original de dicha teoría se basaba en objetivos muy 
prácticos y concretos, mucha de la literatura reciente ha perdido esta orientación. En 
ese sentido, hay varias iniciativas por reorientar el trabajo de estudios sofisticados a su 
simple aplicación en casos empíricos concretos que pueden ser de gran utilidad para la 
sociedad. 
 
Muchos problemas reales no corresponden a un modelo matemático de forma cerrada. 
La recomendación principal efectuada por varios científicos es que el desarrollo de la 
teoría de colas y su práctica no debe estar restringida a aquellos casos donde sí existe 
un modelo preestablecido completamente acoplado; opinan que adaptando algunos de 
estos modelos o bien, mediante el uso de soluciones transformadas sobre modelos 
existentes, los cuales permiten aproximar soluciones e incluso, incorporar algún tipo de 
análisis subjetivo al entorno de la solución, se puede encontrar una mejor aproximación 
para la representación de muchos fenómenos complejos que hoy en día se presentan. 
1.1.2 Objetivos de la teoría de colas 
 
Los objetivos principales que persigue la teoría de colas en la planeación de capacidad 
son: 
 
 
 Capítulo I. Conceptos de Teoría de Colas y su aplicación a la Planeación de la Capacidad 13 
 
 
 Identificar el nivel óptimo de capacidad del sistema que minimice costos (costos 
de espera, de crecimiento e inversión, de operación, etc.). 
 Evaluar el impacto que las posibles alternativas de modificación de la capacidad 
del sistema, tendrían sobre los costos. 
 Establecer un balance equilibrado entre las consideraciones cuantitativas de los 
costos y las cualitativas del servicio. 
1.1.3 Aplicación en áreas comunes 
 
Existen muchos ejemplos de la vida cotidiana donde es aplicable el estudio de teoría de 
colas: una fila para tomar el autobús, la taquilla de un cine, para comprar tortillas, en 
el dentista, los aviones que esperan su turno para despegar o arribar, las colas en un 
banco para pagar la tarjeta de crédito, etc. 
 
De forma general, hoy en día existe un número conocido y no trivial, de áreas de 
aplicación de esta teoría. 
 
El trabajo de Erlang en 1909, estableció el desarrollo de técnicas de probabilidad de 
gran importancia para determinar el número óptimo de líneas telefónicas que 
permitirían manejar la frecuencia de llamada 26 . 
 
Primeramente, estableció el significado del concepto de arribos y servidores, así como, 
lo que debería entenderse por línea de espera; para el caso de los canales telefónicos, 
las llamadas se identificaron como los arribos, la secuencia de llamadas en el tiempo 
conformaba el flujo de entrada y la duración de la llamada, el tiempo de servicio. 
 
La frecuencia de llamadas resultaba difícil de medir porque algunas de éstas podían 
encontrar señales de ocupado, pero finalmente este indicador fue de gran utilidad para 
la descripción de un nuevo fenómeno; se utilizó justamente como parámetro de 
medición para determinar la calidad con que se otorgaba el servicio. Se planteó, con 
base a este resultado, que si el 5% de las veces la señal de ocupado ocurría, la calidad 
del servicio podía considerarse como aceptable. De esa manera, se podía encontrar el 
número de servidores necesario para atender al sistema multicanal, dejando en espera 
a los usuarios sólo un 5% de las veces en promedio, durante el tiempo en que se 
efectuaban las llamadas. 
 
 
 Capítulo I. Conceptos de Teoría de Colas y su aplicación a la Planeación de la Capacidad 14 
 
 
Al replantearse así el problema, los servidores serían entonces los circuitos o las líneas 
telefónicas y la línea de espera sería la colección de llamadas incompletas. 
 
Otros modelos fueron formulados como resultado de algunas variaciones en las 
condiciones propuestas para el modelo original; ejemplo de esto, es su modificación 
para aceptar la existencia de una antesala de espera previa a ser atendido, o bien, el 
que considerara que algunas de las líneas podían ser suspendidas por reparación. 
 
Esta teoría permaneció como la principal aplicación hasta 1950. Desde entonces, otros 
estudios de relevancia han sido realizados sobre problemas de interés para la 
comunidad, tal como es el caso de los aterrizajes de aviones (Galliher and Wheeler 
(1958), Rosenshine (1967,1968)). En este caso, el modelo que se proponía sugería 
considerar a los usuarios como los aviones y los servidores como las pistas de 
despegue-aterrizaje. 
 
Al igual que en el caso anterior, algunos otros trabajos posteriores dieron como 
resultado el planteamiento de nuevos sistemas, como es el caso de los modelos de colas 
en estado dependiente, es decir, donde la tasa de servicio está en función del número de 
usuarios en espera -aplicable también al estudio de problemas de aterrizaje-.En este 
sentido, se asume que los servidores trabajan más rápido para reducir las crecientes 
líneas de espera. La atención entonces no es constante, sino que puede incrementar 
cuando la espera es mayor en un esfuerzo por reducir el tamaño de la cola. La 
dificultad por ofrecer servicio a un arribo adicional sin embargo, también aumenta, 
conforme aumenta la fila de espera. 
 
Algunos ejemplos adicionales de aplicaciones -quizás los de mayor relevancia-, son los 
que tienen que ver con las máquinas en reparación, control de inventarios, el embarco y 
desembarco de transporte marítimo, calendarización de pacientes en clínicas y 
hospitales, flujo de producción, y por supuesto, en el campo de la computación, en lo 
relativo a la calendarización de programas, el procesamiento de tiempo-compartido 
(“time-sharing”) de los equipos “Mainframe”, algunos diseños de sistemas y en mensajes 
de comunicación digital a través de redes complejas, así como el impacto sobre los 
servicios WEB, que forman parte de los trabajos más recientes que han generado mayor 
auge en este campo. Otros ejemplos más conciernen a las áreas de salud. 
 
 
 
 Capítulo I. Conceptos de Teoría de Colas y su aplicación a la Planeación de la Capacidad 15 
 
 
1.2 Administración de la capacidad y la planeación de la capacidad 
 
La administración de la capacidad, como disciplina de la administración de la entrega 
de servicios (“Delivery Management”) de acuerdo a un modelo “ISO/IEC 20000” (también 
llamado “ITIL” V3), involucra funciones de gran importancia entre las que se incluyen la 
afinación de sistemas, la consolidación de servidores y la planeación de la capacidad. 
 
Los requerimientos de información en la administración de la capacidad difieren de la 
relacionada con la administración del desempeño. 
 
En la administración del desempeño (“Performance Management”), cuando un problema 
relacionado con un inadecuado tiempo de respuesta o un insuficiente volumen de 
proceso ocurre, un umbral se alcanza, se genera una alerta y se examinan las causas 
que determinan las condiciones de degradación. Estos indicadores tienen un 
comportamiento casi siempre como un semáforo (verde/continuo, amarillo/alerta, 
rojo/crítico). La información de “performance” es típicamente mantenida con una 
granularidad fina por períodos de tiempo cortos y de acuerdo al nivel de alerta, se 
toman acciones (ligeras-moderadas-drásticas) que corrigen el problema, de forma 
automática o manual. 
 
En la administración de la capacidad (“Capacity Management”), no existen umbrales 
que observar; las muestras de información son colectadas por períodos de tiempo según 
el tipo de administración que se desea realizar. Se observan picos (“peaks”) durante el 
período, así como ciclos adicionales, tales como el procesamiento de fin de mes o las 
fluctuaciones estacionales durante el período. El tipo de administración determina qué 
cargas (“workload”) deberán ser seleccionadas para evaluación, las métricas a colectar 
y cuánto tiempo de información se requiere, así como el tiempo que ésta deberá ser 
retenida. 
 
La afinación de sistemas (“System Tuning”), por ejemplo, es una actividad dependiente 
de la plataforma, que usa las métricas de utilización de las cargas (“workload 
utilisation”) y la configuración del ambiente para identificar los actuales “cuellos de 
botella” (“bottlenecks”) y problemas de capacidad restringida (“constraints”). La 
información es usada para cambiar las cargas o la configuración, así como, para 
incrementar el desempeño previo a la consolidación de servidores o a la construcción de 
modelos para efectuar un plan de capacidad. La afinación requiere un amplio 
conocimiento del sistema operativo, del entorno de “software”, de las aplicaciones y los 
 
 Capítulo I. Conceptos de Teoría de Colas y su aplicación a la Planeación de la Capacidad 16 
 
 
parámetros del sistema para controlar el ambiente. Frecuentemente se requiere de un 
ajuste cuidadoso de parámetros para el manejo de prioridades, reemplazo de discos o 
distribución de la memoria. Estas actividades permiten “liberar” la carga de trabajo no 
procesada (i.e., carga pendiente de ejecución), llamada demanda latente, que no es 
claramente visible sino hasta el momento que entra en ejecución. 
 
El análisis de la consolidación de servidores (“Consolidation Servers”), requiere de la 
observación de métricas de utilización de servidores sobre el tiempo, a efecto de 
identificar tendencia en el consumo de recursos, así como interdependencia en la 
información. Los reportes de utilización a largo plazo, pueden ayudar a los técnicos a 
identificar candidatos para generar consolidación o redistribución de las cargas de 
trabajo, así como identificar requerimientos para el procesamiento de picos en horarios 
de mayor utilización. 
 
La planeación de la capacidad (“Capacity Planning”) no requiere un conocimiento íntimo 
del sistema ni de los efectos de sus parámetros. En lugar de esto, los componentes del 
sistema se miden de forma global y sólo se mide respuesta a estímulos tales como 
cambios en las cargas o en las características físicas de los componentes. Normalmente, 
un estudio de capacidad es apropiado sólo cuando se ha realizado una adecuada 
afinación y los usuarios experimentan un desempeño razonable en el sistema durante 
un período medio. 
 
De acuerdo a ciertos autores [21], que han dado formalidad al estudio de la planeación 
de la capacidad y la han incorporado a la estructura ITIL, consideran que dicha 
administración debe contar mínimamente con los siguientes pasos: 
 
1) Monitoreo del desempeño y volumen de proceso (“throughput”) de los servicios de 
TI y soporte a componentes de infraestructura. 
2) Ejecución de actividades de afinación para hacer más eficiente el uso de 
recursos existentes. 
3) Entendimiento de las demandas actuales sobre recursos tecnológicos y 
desarrollo de proyecciones sobre futuros requerimientos. 
4) Influencia sobre la demanda de recursos, incluso de forma conjunta con las 
áreas financieras. 
5) Producción de un plan de capacidad que permita a los proveedores de servicio 
(internos o externos), otorgar servicios de acuerdo a la calidad requerida y 
 
 Capítulo I. Conceptos de Teoría de Colas y su aplicación a la Planeación de la Capacidad 17 
 
 
estipulada en los acuerdos de niveles de servicio (“Service Level Agreements” 
[SLAs]). 
1.2.1 Almacenamiento y retención de la información 
 
Una consideración importante es la del almacenamiento y las políticas de retención de 
datos. 
 
La información que sustenta a estos análisis, consume una cantidad significativa de 
espacio de almacenamiento y por otro lado, pierde rápidamente su valor, conforme la 
operación y el procesamiento en el equipo continúan. El nivel de detalle está en función 
del tiempo y de ello depende su valor; si los resultados no son pormenorizados o están 
desactualizados, resultan en ocasiones poco útiles para cierto tipo de análisis. Otras 
veces, los datos son muy recientes, lo que impide determinar la tendencia o 
comportamiento que ha tenido cierto fenómeno a través del tiempo. 
 
En el reporteo de niveles de servicio, una pequeña cantidad o subconjunto de la 
información es utilizado y ningún tipo de procesamiento sobre éste se requiere; en 
cambio, para un plan de capacidad, sólo se aplican los datos de resumen de cargas y el 
consumo de recursos representando los períodos pico. 
 
El manejo de diferentes niveles de almacenamiento puede ser conveniente para diversos 
propósitos. En algunos casos, la información debe guardarse con base a criterios tales 
como la ocurrencia de eventos de negocio o del proceso. Por ejemplo, sobre la demanda 
de procesamiento para efectuar cierres mensuales, es posible realizar una acumulación 
permanente que sólo considere los datos de estos picos durante el año. 
 
El período de proyección,referido como el tiempo estimado en el cual es válida la 
capacidad proyectada, no suele ser demasiado largo -8 a 12 meses suele ser razonable- 
pero principalmente dependerá de los cambios que requiera el propio computador y del 
tipo de proceso que corra en él; de existir un cambio en sus características, la vigencia 
de la proyección posiblemente se perdería. 
 
Debido al alto volumen de información que se maneja, una práctica común es efectuar 
almacenamiento de datos resumidos cada 15 o 30 minutos; así mismo, la colección de 
datos, realizada por monitores internos del sistema operativo, es cubierta generalmente 
en intervalos regulares de 30 segundos, a pesar de que algunos procesos llegan a tardar 
 
 Capítulo I. Conceptos de Teoría de Colas y su aplicación a la Planeación de la Capacidad 18 
 
 
menos en ejecutarse. Pueden aplicarse algunos filtros de información, dependiendo de 
la configuración de parámetros que se realice para su colección. Los días pico son 
sumamente importantes, ya que por definición, la administración de capacidad debe 
cubrir cualquier requerimiento de consumo de recursos, especialmente en momentos 
en que la carga de trabajo es muy alta. De ahí que se consideren, principalmente, los 
días críticos y los puntos de mayor actividad operativa para realizar un plan adecuado 
de capacidad, sin embargo, observar la repetición de estos momentos durante un 
período más largo, garantiza que no sólo se trate de una eventualidad o un registro 
atípico, sino de un comportamiento regular o una circunstancia que deba considerarse 
como base para la proyección. 
 
La consolidación y agregado de los datos, es parte importante del proceso de 
mantenimiento; la estrategia que se utilice para llevar a cabo estas actividades, 
proporcionará garantías para realizar con éxito su administración. 
1.2.2 Caracterización de cargas de información 
 
La tarea de crear agrupaciones lógicas de acuerdo a la actividad de los recursos, se 
llama caracterización de cargas (“workload characterization”). Las aplicaciones de 
negocio (“business applications”) están compuestas por uno o más procesos que 
trabajan para proveer o crear una función orientada a un propósito particular, es decir, 
una “función de negocio”. Para monitorear, analizar, diseñar y realizar la planeación de 
capacidad de dichas aplicaciones de una manera efectiva, es vital que se entienda 
exactamente lo que cada proceso consume. Es por esto que se necesitan mediciones 
específicas sobre la demanda que se genera sobre ciertos recursos de infraestructura, 
diseñando posteriormente modelos que permiten conocer los aspectos estáticos –
recursos- y los dinámicos –aspectos funcionales y de operación- de dichas cargas, a fin 
de que posteriormente pueda llevarse a cabo su caracterización - técnicas como análisis 
de clusters y procesos estocásticos son altamente utilizados para estos estudios. 
1.2.3 Generación de reportes. 
 
El manejo dinámico de documentos, gráficas y cualquier tipo de reporte puede ser 
calendarizado por días, semanas, meses o sobre demanda. Éstos pueden ser generados 
por herramientas de reporteo y ser exportados a diferentes aplicaciones con el propósito 
de obtener consolidados de información o resúmenes gráficos. 
 
 
 Capítulo I. Conceptos de Teoría de Colas y su aplicación a la Planeación de la Capacidad 19 
 
 
Los resultados pueden servir para determinar los impactos sobre cambios en las cargas 
o la configuración. 
Una práctica común es reportar esta información en páginas Web de la propia 
institución, sin embargo, para proyectos de planeación de capacidad, es más común 
presentar los reportes en papel, acompañados de gráficos por tipo de carga y un 
análisis sobre la proyección obtenida, concluyendo con algunas recomendaciones para 
su ejecución. 
1.3 Las colas y la planeación de capacidad en los equipos “Mainframe”. 
1.3.1 Importancia de las líneas de espera en los equipos “Mainframe” 
 
En los equipos de cómputo IBM “Mainframe”, esencialmente existen dos tipos de 
trabajos: el “batch” y el “online” -o interactivo, típicamente, representado por 
transacciones “CICS”-, sin embargo, sin importar su tipo, y debido a la arquitectura con 
que fueron diseñados estos procesadores, cualquier trabajo que requiera atención (un 
programa de usuario final, una rutina de atención interna,etc.), su ejecución dependerá 
de que se forme en filas y, de acuerdo a la prioridad que le asigne el sistema operativo 
conforme a sus características, competirá con el resto de los trabajos para recibir un 
servicio del computador central. 
 
El procesamiento interno de un trabajo “batch” dentro de un “Mainframe” se describe 
de la siguiente manera: cualquier proceso que entra a ejecución al sistema es 
particionado en pequeños elementos llamados trabajos o tareas que serán ejecutados de 
manera individual dentro del procesador. Cada tarea es enviada a ejecución 
(“submited”) a través del JES2, que es un componente del sistema encargado del flujo, 
calendarización y salida de procesos. Con la ayuda de manejadores y llamadas a 
supervisores (“supervisor’s calls o SVCs”), se determina si los recursos que el trabajo 
requiere, se encuentran disponibles para su ejecución. En caso de no ser así, el 
supervisor solicita apoyo al subsistema correspondiente (de I/O, memoria, etc.), y 
mediante la intervención de los manejadores, se provee de los recursos necesarios para 
que la tarea pueda ser integrada al flujo (“stream”) de procesamiento. Una vez que la 
tarea se encuentra lista para ejecución (estado de “ready”), queda formada en las filas o 
colas de “ready” para esperar su turno y, conforme a la prioridad asignada y al número 
de unidades de trabajo3 de CPU otorgadas para su ejecución -éstas dependerán del tipo 
 
3
 Unidades de trabajo o quantum 
 
 Capítulo I. Conceptos de Teoría de Colas y su aplicación a la Planeación de la Capacidad 20 
 
 
de cálculo que efectúe durante su ejecución, i.e., más “CPU bound” o más “I/O bound”-, 
recibirá el correspondiente servicio, a través de un iniciador. 
 
La tarea comienza su proceso pero si en cierto momento requiere de un recurso para 
poder continuar, se emite una llamada al supervisor, el cual genera a su vez una 
interrupción (“interruption”), poniendo a la tarea en estado de indispuesta (estado de 
“wait”) y enviándola en consecuencia, a las colas de “wait”. 
 
Cuando todos los requerimientos han sido resueltos por el correspondiente subsistema, 
nuevamente la tarea se enfila en las colas de “ready” y espera turno hasta que llegado el 
momento, entra nuevamente a ejecución. Al momento de reingreso, le es también 
reasignado el número de unidades de CPU restantes con que contaba, justo antes de su 
su interrupción. 
 
Puesto que los recursos no son ilimitados y debido a la lógica de multiproceso y 
multitareas (“multiprocess/multitasking”) con la que fueron diseñados los equipos, los 
recursos son compartidos entre diferentes procesos. Una vez que la tarea en ejecución 
ha agotado sus unidades de trabajo –lo cual es independiente de si contaba o no con 
todos los recursos operativos para su ejecución-, y requiere de unidades adicionales 
para completar su procesamiento, ésta será interrumpida, forzada a permanecer 
temporalmente fuera de ejecución (estado de “swapped”) y enviada nuevamente a las 
filas de “wait” para ser resurtida, mientras que otros trabajos en estado de “ready”, 
entran a ejecución y son servidos por el procesador. 
 
Cuando la facilidad de servicio es múltiple, sin importar en qué servidor se encontraba 
trabajando al momento de efectuar un “swap” o un “wait” por recursos o por unidades 
de CPU, y reiniciar su actividad, se le asignará uno disponible -el previamente asignado 
o cualquier otro que se encuentre libre-, y mediante una secuencia de continuos 
“interrupt-swapped-wait-ready”,la tarea podrá estar cambiando de procesador hasta 
terminar su proceso. Este mecanismo se realiza de forma repetida y de manera 
continua, mientras que de forma paralela, va arribando nuevo trabajo para ser 
procesado. 
 
La esencia de este mecanismo, es el concepto llamado “time-sharing process” (proceso 
de tiempo compartido), pues justamente permite compartir el computador entre 
 
 Capítulo I. Conceptos de Teoría de Colas y su aplicación a la Planeación de la Capacidad 21 
 
 
múltiples trabajos en ejecución y de ahí que éstos, durante diferentes fases de su 
proceso, tengan que esperar en filas para ganar nuevamente su turno de ejecución. 
 
El proceso total de cada tarea ocurre casi siempre en fracciones de segundo, por lo que 
resulta casi imperceptible que múltiples procesos se encuentren compitiendo de manera 
simultánea por atención. A la vista de los usuarios, es prácticamente como si cada uno 
tuviera un tiempo dedicado para su realización. 
 
Por lo anterior, el tiempo de respuesta de cualquier tarea del sistema, se forma de un 
tiempo de espera -por canales, por memoria, por I/O, por unidades de CPU, etc.- y un 
tiempo en que el CPU lo procesa. 
 
A diferencia de los programas “batch”, el CICS no realiza llamadas directas al sistema 
operativo; éste emite comandos para realizar funciones de acceso a la terminal, a un 
archivo, a un programa de control y a otras funciones; dicho manejador se comporta 
como un mini-sistema operativo para ejecutar los programas dentro de su región virtual 
(espacio de direcciones de memoria), interactuando a su vez con el sistema operativo 
principal, teniendo así acceso al CPU. 
 
Cuando una tarea de CICS (“active task”) se ejecuta, ésta tiene control sobre el CPU. 
Cuando la tarea requiere de un servicio a la mitad de su proceso (por ejemplo, leer 
alguna información), la tarea cede el control del procesador a un “despachador” 
(función del sistema operativo que forma parte del control de tareas de CICS) y mientras 
espera por recursos, otras tareas son ejecutadas. En ese estado, la tarea se encuentra 
en “wait”. Nuevamente, en cuanto la tarea se encuentra lista para ejecución –una vez 
servido su requerimiento- y si ésta mantiene la más alta prioridad entre las que 
esperan por ser atendidas por el procesador, su ejecución reinicia y se efectúa un 
“resumption”. 
 
Por la semejanza en ambos tipos de procesos, es claro que un sistema así, puede ser 
representado por un modelo de colas, donde el servidor, formado por uno o múltiples 
procesadores, es el “sistema de servicio” y donde los “usuarios o clientes” son las tareas 
o trabajos que requieren atención por parte de ese servidor y que, por el mecanismo de 
atención con el que trabajan, esperan su turno en filas para ser atendidos de acuerdo a 
su prioridad. 
 
 
 Capítulo I. Conceptos de Teoría de Colas y su aplicación a la Planeación de la Capacidad 22 
 
 
Se concluye que: el sistema con que opera y procesa un equipo “Mainframe” puede estar 
representado por un modelo de colas; de hecho, se trata de uno de tipo complejo o en 
red (“networked queue”), donde cada una de las funciones que realiza (I/O, paginación, 
acceso a memoria, etc.), pudiera estar representada por modelos de colas simples e 
individuales, con un mecanismo específico de atención y ligados entre sí -la entrada de 
un sistema puede ser la salida de otro-. 
 
Cuando un sistema no cuenta con capacidad suficiente para atender todo el volumen 
de proceso (“throughput”), tiende a formar filas más grandes (de “wait” o “swap”) hasta 
el punto en que puede llegar a bloquearse y “caer”. Los problemas de desempeño son 
evidentes, afectando claramente la continuidad de los servicios. La importancia de 
estudiar este tipo de sistemas y particularmente el mecanismo asociado a su 
desempeño, así como, poder planear la capacidad para atender requerimientos actuales 
y futuros, permite anticipar algunas de las situaciones que ponen en riesgo la 
disponibilidad del equipo, la calidad del servicio otorgado y la propia supervivencia del 
negocio. 
 
Un mensaje que requiere transmisión, un programa que solicita acceso a una base de 
datos, una transacción en línea que espera respuesta del procesador, son problemas 
computacionales que pueden ser estudiados y resueltos mediante el uso de modelos de 
colas y los parámetros de desempeño que éstos proveen. 
1.3.2 Problemas de la planeación de la capacidad 
 
1) Múltiples métodos, múltiples resultados 
 
En la actualidad, los planes de capacidad son una práctica generalmente realizada por 
el personal técnico propio de la organización. Puesto que implica un análisis para la 
adquisición de un mayor espacio de almacenamiento o procesamiento e incluso, de 
nuevos equipos, es común pedir una segunda e incluso, una tercera opinión. Una o 
varias entidades externas son invitadas y se encargan de solicitar información, 
manipulándola según sus propios métodos para obtener resultados que al momento de 
su comparación, muchas veces divergen de los otros en su conclusión. 
 
La divergencia entre los estudios, es frecuentemente “resuelta” eligiendo un tamaño de 
equipo acorde con un “tope financiero” y con la “aceptación” de que algunos problemas 
podrían presentarse durante un cierto tiempo hasta poderlos “resolver” posteriormente 
con una mayor inversión. En otros casos, particularmente en las empresas con mayor 
 
 Capítulo I. Conceptos de Teoría de Colas y su aplicación a la Planeación de la Capacidad 23 
 
 
poder adquisitivo, la diferencia se “resuelve” sobreestimando la capacidad –por ejemplo, 
tomando el máximo valor obtenido entre los diferentes resultados- a fin de encubrir los 
posibles errores de estimación y las diferencias en los análisis. Mientras que en el 
primer caso, casi siempre provoca insatisfacción en el servicio, en el segundo implica 
desperdicios significativos y costos financieros sin beneficio alguno para la empresa. 
 
2) Limitaciones de la ITIL 
 
Existen muchas formas de realizar planeación de la capacidad y a pesar de lo que la 
ITIL propone para regular el proceso, éste alcanza la forma del qué – el deber ser - y no 
del cómo, para verdaderamente lograr efectividad; se tiene, por lo tanto, un marco de 
referencia conformado por “mejores prácticas” para optimizar la implantación de 
procesos de TI, sin embargo, no establece lineamientos para su implementación. 
 
3) Reglas heterogéneas 
 
Puesto que cada organización elige su propia metodología, la subjetividad de los planes 
de capacidad depende de los parámetros y reglas basadas en la experiencia y en el 
conocimiento que cada entidad desea aplicar. 
 
4) Decisiones financieras sin sustento técnico 
 
Las políticas de reducción de costos de las áreas financieras y la falta de justificación 
técnica sustentable en los estudios, conllevan en muchas ocasiones a tomar decisiones 
inconvenientes para la operación. 
 
5) Planeación de la capacidad alternada con otras funciones 
 
Un problema común es entremezclar los planes de capacidad con actividades de 
optimización y administración para mejora del desempeño. Cada esfuerzo tiene su 
momento, por lo que la optimización o los ajustes en la operación deben ser realizados 
de forma previa al desarrollo de un plan de capacidad y nunca durante la ejecución de 
éste. La consistencia de la información no será la misma cuando se genera un cambio 
en el ambiente, por lo que esto puede afectar definitivamente al análisis y con ello, 
sobreestimar o subestimar la capacidad, según el caso. 
 
 
 
 
 
 Capítulo I. Conceptos de Teoría de Colas y su aplicación a la Planeación de la Capacidad 24 
 
 
6) No se activa la colección ni almacenamiento de información 
 
 
Los estudios de planeación de capacidad se basan en información histórica y de 
tendencia, lo que en ocasiones implica la manipulación y almacenamiento de unvolumen considerable de información. Puesto que mantener demasiado detalle en la 
información no siempre puede ser sostenido ya que además implica un gran esfuerzo de 
administración, en ocasiones, los técnicos deciden no efectuar la colección y 
almacenamiento de registros, salvo en fechas muy próximas al desarrollo de un plan de 
capacidad. Esto repercute negativamente en los resultados, ya que generalmente el 
proceso se reactiva por un período corto de tiempo previo al estudio, lo que no 
necesariamente resulta representativo ni una base sólida para proyectar un plan. Un 
ejemplo: si el plan de capacidad de un gran almacén se realiza en agosto y sólo se toma 
como base de información los meses de junio y julio, es seguro que se está ignorando 
información valiosa para la proyección. En México, en el mes de mayo y más 
concretamente, en el día 10 de mayo, se realiza la venta máxima, i.e., el 80% de las 
ventas de todo el año, se efectúa en esa fecha. 
 
Es claro que la planeación de capacidad no es una práctica totalmente controlada y 
mucho menos sustentada. Se requiere de la fortaleza de algunas herramientas, 
metodologías y recursos que puedan dar consistencia, así como, homogeneidad a los 
estudios, ya que de los resultados que se obtengan de éstos, dependerá la operación 
futura de una organización. 
 
La probabilidad ofrece un sustento matemático para el modelaje de problemas de 
capacidad. En el siguiente capítulo se muestran algunos conceptos de importancia que 
son la base fundamental para el estudio de las líneas de espera a través de los modelos 
de teoría de colas. 
 
 
 
 Capítulo II .Procesos estocásticos 25 
 
 
II Procesos Estocásticos 
 
2.1 Proceso estocástico y su clasificación. Casos especiales. 
2.1.1 Definición de proceso estocástico 
 
Un proceso estocástico es una abstracción matemática de un proceso empírico cuyo 
desarrollo se basa en las leyes de probabilidad. Su definición formal es la siguiente: 
 
“Es una colección o familia de variables aleatorias cuyo índice t recorre un conjunto T , 
i.e.,  ( ), ,X t t T t índice. T es generalmente un rango de tiempo, y está definido como 
el conjunto índice del proceso” [2,27]. 
 
( )X t
 
es una variable aleatoria que denota el estado de un proceso en el tiempo y 
representa una característica de interés medible en el instante t de tiempo. Su espacio 
de estados, es el conjunto de todos los posibles valores que las variables aleatorias 
( )X t pueden asumir; cada uno de los valores es llamado un “estado del proceso” y un 
elemento t T es referido como el tiempo y bajo este parámetro, se indexa el proceso. 
 
El conjunto índice puede tomar valores continuos o discretos; de igual manera, el 
espacio de estados es clasificado como discreto o continuo, según la naturaleza de las 
variables aleatorias y los valores que éstas toman. 
2.1.1.1 Parámetro discreto y continuo 
 
Si T es una secuencia numerable, {0, 1, 2,..}T    o  0,1,2.....T  , entonces el 
proceso estocástico  ( ),X t t T se define como de parámetro discreto, si tiene como 
base el conjunto índice T . Para fines prácticos, se supondrá T  Z y es expresado de 
igual manera como  nX . 
 
Si T es un intervalo o una combinación algebraica de intervalos,  :T t t     
o  : 0T t t    , entonces el proceso estocástico  ( ),X t t T se define como de 
 
 
 Capítulo II .Procesos estocásticos 26 
 
 
parámetro continuo, si tiene como base el conjunto índice T . Para fines prácticos, se 
supondrá T  R e igualmente expresado como  , 0tX t  . 
2.1.1.2 Espacio de estados discretos y continuos. 
 
Un número real x es un estado de un proceso estocástico si dado  ( ),X t t T , 
 , 0t T h   tal que  Pr ( ) 0x h X t x h     i.e. Pr ( ) 0X t x h     . 
 
El espacio de estados del proceso es el conjunto de todos los posibles valores que las 
variables aleatorias ( )X t pueden asumir. Si el proceso  ( )X t está en el estado x en el 
instante t , significa que el evento  ( )X t x ha ocurrido. 
 
El espacio de estados puede estar contenido en Z o en R , es decir, las variables 
aleatorias son discretas o continuas. 
 
Se dice que  ( )X t es un proceso de estado discreto si para un conjunto numerable P , 
entonces Pr( ( ) ) 1, .X t P t   
 
De igual manera, se asume que si  ( )X t es un proceso de estado continuo, entonces 
las ( )X t toman valores sobre un intervalo continuo (finito o infinito) sobre los reales. 
2.2 Procesos de conteo 
 
Un proceso estocástico  ( ), 0N t t  , constituye un proceso de conteo si cumple con las 
siguientes características: 
 
i) (0) 0,N  
ii) ( )N t asume valores enteros no negativos, 
iii) s t implica ( ) ( )N s N t , 
iv) ( ) ( )N t N s es el número de eventos que han ocurrido después de s pero no más 
allá de t , es decir, en el intervalo ( , ]s t . 
 
 
 Capítulo II .Procesos estocásticos 27 
 
 
Los eventos descritos por una función ( )N t
, 
están definidos para 0t  , es decir, han 
ocurrido después de 0 , pero no después de t . El tiempo 0t  representa el punto 
donde se inicia el conteo. 
 
Para cada t , el número ( )N t es el valor observado de una variable aleatoria. Una 
representación gráfica de un proceso ( )N t puede ser la siguiente: 
 
 
2.3 Proceso Poisson 
 
Un proceso de conteo  ( ), 0N t t  es un proceso Poisson con tasa  > 0, si se cumplen 
los siguientes puntos: 
 
i) Tiene incrementos independientes, i.e., los eventos que ocurren en intervalos no 
traslapados de tiempo no dependen entre sí4. 
 
4
 Sean 
1 1
( , ), .........( , )
n n
a b a b intervalos no traslapados, entonces las n variables aleatorias: 
1 1 2 2 3 3
( ) ( ), ( ) ( ), ( ) ( ), ............ ( ) ( )
n n
X b X a X b X a X b X a X b X a    son independientes. 
 
 
 
 Capítulo II .Procesos estocásticos 28 
 
 
ii) Los incrementos del proceso son estacionarios; la distribución del número de 
eventos en cualquier intervalo de tiempo depende sólo de la longitud de éste y 
no de donde inicia5. 
 
iii) La probabilidad de que exactamente un evento ocurra en un intervalo de tiempo 
de longitud h es ( )h o h  6, es decir, 
 
 ( ) 1 ( )P N h h o h   . 
 
iv) La probabilidad de que más de 1 evento ocurra en un intervalo de longitud h es 
( )o h , es decir, 
 ( ) 2 ( )P N h o h  . 
 
Los procesos ( )N t tienen diversas aplicaciones tales como en los centros de reservación 
de líneas aéreas, en los sistemas telefónicos, en los problemas computacionales tales 
como la interrupción de fin de archivo, la ocurrencia de fallas de “hardware” o 
“software”, así como, otros ejemplos más de la vida cotidiana. De manera enunciativa, 
se indican los siguientes teoremas 7 : 
 
Teorema 2.3.1. Sea  ( ), 0N t t  un proceso Poisson con una tasa  >0. Entonces la 
variable aleatoria Y que describe el número de eventos en cualquier intervalo de tiempo 
de longitud 0t> , tiene una distribución Poisson con parámetros t , i.e., 
 
 
( )
!
k
t tP Y k e
k
   , 0,1,2,.....k  , 
 
5 Incrementos estacionarios significa que ( ) ( )X t h X s h   tiene la misma distribución que ( ) ( )X t X s 
para cada elección de índices s y t y para cada 0h  . De esta forma la distribución ( ) ( )X t X s depende 
sólode la longitud del intervalo, es decir, desde s hasta t y no del valor particular de s donde se inicia. 
6 Una función f es ( )o h si 
0
( )
lim 0
h
f h
h
 es decir, si dada 0 > , existe una 0 > tal que si 0 h < < , 
implica que : 
( )f h
h
 
7 Para referencias de demostración, ver  1 . 
 
 
 Capítulo II .Procesos estocásticos 29 
 
 
 
Teorema 2.3.2. Sea  ( ), 0N t t  un proceso Poisson con una tasa  >0. Sean 
1 2 3 4
0 ...t t t t< < < < , los tiempos sucesivos de ocurrencia de eventos. Sean  n , los 
tiempos de interocurrencia o interarribo, definidos como 
1 1t  , 2 2 1t t   , 3 3 2t t   ,…….; 
entonces,  n son variables aleatorias exponenciales mutuamente independientes e 
idénticamente distribuidas con media 
1

. 
 
Teorema 2.3.3. Sea  ( ), 0N t t  un proceso de conteo tal que los tiempos de interarribo 
de los eventos  n , son variables aleatorias exponenciales idénticamente distribuidas, 
con media 
1

, entonces  ( ), 0N t t  es un proceso Poisson con tasa  . 
2.4 Proceso de nacimiento y muerte (N-M). 
 
Un proceso Poisson  ( ), 0N t t  , que cuenta el número de ocurrencias o arribos de 
cierto tipo de eventos, también puede servir para interpretar el nacimiento de algunas 
entidades con tasa promedio  , i.e., cada arribo puede ser interpretado como un 
nacimiento. 
 
Para un proceso Poisson, la probabilidad de que ocurra un nacimiento en un intervalo 
pequeño h es ( )
h
he h o h

 

  . Esta probabilidad es independiente de cuántos 
nacimientos han ocurrido y donde  puede ser pensada como la tasa de nacimiento; 
sin embargo, en la vida real, es más común que el número de nacimientos dependa de 
la población existente, i.e., del número n de individuos. 
 
Por lo tanto, dicha probabilidad se dice que es igual a ( )nh o h  . De igual manera, es 
concebible considerar que ocurra una muerte en un intervalo de longitud h y su 
probabilidad sea igual a 1 ( )
n
h
e h o h



  . 
 
 
 
 Capítulo II .Procesos estocásticos 30 
 
 
La idea intuitiva detrás del proceso de nacimiento y muerte es la de una población que 
simultáneamente “gana” nuevos miembros (nacimientos) mientras “pierde” viejos 
miembros (muertes), y que estos dependan del número de individuos existente, como 
ocurre en el caso de la población humana. 
2.4.1 Definición del proceso N-M 
 
Sea un proceso estocástico de parámetro continuo  ( ), 0X t t  con un espacio de 
estados discreto  0,1,2,3.... . Supóngase que  ( ), 0X t t  describe un sistema que se 
encuentra en el estado nE , donde 0,1,2,3,.....n  al tiempo t , si y sólo si, ( ) ,X t n 
i.e., el sistema tiene una población con n elementos o usuarios en el tiempo t . 
 
Se dice, entonces, que el sistema está descrito por un proceso de nacimiento y muerte 
(N-M) si existen tasas no negativas de nacimientos  ,n 0,1,2,3,...n  y tasas no 
negativas de muerte  n , 0,1,2,3,...n  , tal que los siguientes postulados se 
satisfacen: 
 
Postulados del “vecino más cercano” (“nearest-neighbor”) 
 
1) Un cambio de estado es factible sólo de un estado nE a un estado 1nE  , o desde 
un estado nE a un estado 1nE  si 1n  , pero del estado 0E al 1E si 0n  . 
 
2) Si al tiempo t , el sistema está en el estado nE y la probabilidad de que, entre el 
tiempo t y el tiempo t h , la transición desde nE a 1nE  ocurra (se indica 
como 1n nE E  ), es igual a ( )nh o h  , y la probabilidad de que la transacción 
1n nE E  ocurra, es igual a ( )nh o h  , si 1n  . 
 
3) La probabilidad de que, en el intervalo de tiempo desde t hasta t h con 
longitud h , más de una transición pueda ocurrir, es o(h). 
 
 
 
 
 
 
 Capítulo II .Procesos estocásticos 31 
 
 
2.4.1.1 Sistema de colas como proceso de N-M 
 
Un sistema de colas se dice que es descrito por un proceso de nacimiento y muerte si 
puede pensarse al estado nE como un sistema con n clientes, ya sea esperando o 
recibiendo servicio. 
 
De acuerdo a los postulados antes descritos, se tiene que: 
 
 El postulado 1 permite que un sólo nacimiento o una sola muerte ocurran en el 
tiempo t ; ninguna muerte puede ocurrir si el sistema está vacío. 
 El postulado 2 proporciona las probabilidades de transición, es decir, la 
probabilidad de que un nacimiento o una muerte ocurra en un intervalo 
pequeño de tiempo, cuando la población cuenta con n usuarios. 
 El postulado 3 refiere a la probabilidad de que más de un nacimiento o muerte 
ocurra en un intervalo de tiempo pequeño h . Esta probabilidad es 
insignificante. 
 
2.4.1.2 Proceso Poisson de nacimiento puro 
 
La probabilidad ( )nP t h de que al tiempo t h el sistema se encuentre en el estado 
nE , si 1n  , puede expresarse usando los postulados antes considerados. De esta 
forma, se tiene que: 
 
 1 1 1 1( ) 1 ( ) ( ) ( ) ( )n n n n n n n nP t h h h P t hP t hP t o h             
 
de donde se despeja h y se llega a: 
 
1 1 1 1
( ) ( ) ( )
( ) ( ) ( ) ( )n n n n n n n n n
P t h P t o h
P t P t P t
h h
      
 
      
 
y tomando el límite cuando 0h  , se obtiene: 
 
1 1 1 1
( )
( ) ( ) ( ) ( ),n n n n n n n n
dP t
P t P t P t
dt
           para 1n  ….(a) 
 
 
 Capítulo II .Procesos estocásticos 32 
 
 
 
y además, 
 0 0 0 1 1
( )
( ) ( ),
dP t
P t P t
dt
    para 0n  ......(b) 
 
Por lo que, tomando (a) y (b), se establece un sistema de ecuaciones diferenciales en 
diferencias. 
 
Se concluye entonces, que un proceso de nacimiento y muerte depende de un número 
infinito de ecuaciones diferenciales en diferencias y su solución es compleja si se 
obtiene de forma analítica, salvo para casos especiales, como se muestra a 
continuación: 
 
Si el estado inicial es iE , entonces las condiciones iniciales están dadas por: 
 
(0) 1iP  y (0) 0jP  para j i , 
 
Ahora, si se considera el caso de un proceso de nacimiento puro, i.e., cuando 0n  > , 
 n y 0n  , n , con condiciones iniciales 0(0) 1,P  (0) 0,jP  y 0j  , entonces el 
sistema se reduce a: 
 
1 1
( )
( ) ( ),n n n n n
dP t
P t P t
dt
     
 
1n  ………..(a’) 
0
0 0
( )
( ),
dP t
P t
dt
 
 
0n  ………..(b’) 
 
Si la condición inicial es  0(0) (0) 0 1P P N   , se tiene que 0( )
tP t e  . Si 1n  y la 
condición inicial es (0) 0nP  , entonces se tiene la siguiente solución: 
( )
( ) 0, 0
!
t n
n
e t
P t n t
n
 
  , 
es decir, se trata justamente de la distribución Poisson. 
 
 
 
 Capítulo II .Procesos estocásticos 33 
 
 
Lo anterior, permite concluir que un proceso Poisson también puede ser caracterizado 
como un proceso de nacimiento puro, donde la tasa de nacimiento es constante. 
2.4.1.3 Soluciones a las ecuaciones diferenciales en diferencias. 
 
De manera general, es difícil encontrar soluciones de tiempo-dependiente  ( )nP t para 
un proceso de nacimiento y muerte, sin embargo, cuando el valor de ( )nP t se aproxima 
a una constante np al hacer t  para cada n , el sistema podrá encontrar el 
equilibrio estadístico. 
 
Bajo condiciones muy generales, estos límites existen y sonindependientes de las 
condiciones iniciales. 
 
Cuando un sistema está en equilibrio estadístico, se dice que el sistema se encuentra 
en estado estacionario o estable, ya que no depende del tiempo. Se pueden obtener las 
soluciones de estado estacionario  np bajo la siguiente fórmula: 
 
lim ( )n n
t
P t p

 , 0,1,2,3....n  
 
Una forma de encontrar soluciones de tiempo-dependiente o transitorias (temporales) 
para las ecuaciones diferenciales en diferencias de nacimiento y muerte (a) y (b), es 
mediante aproximaciones a la solución. De forma analítica, haciendo t  y 
aplicando esto a ambos lados de las ecuaciones (a) y (b), así como usando el hecho de 
que: 
( )
lim 0,n
t
dP t
n
dt
  
y asumiendo que existan las soluciones de estado estacionario  np y que, 
lim ( )
n n
t
P t p

 
se obtiene que, 
 
1 1 1 10 ( ) ,n n n n n n np p p          1n  .....(c) 
 1 1 0 0
0 ,p p  
 
 0n  ..…(d). 
 
 
 Capítulo II .Procesos estocásticos 34 
 
 
 
De ahí, que 
 0
1 0
1
( )p p


 
y reescribiendo (c) como: 
 
1 1 1 1,n n n n n n n np p p p         1n  …. (c’) 
 
entonces, si se define 1 1, 1,2,3,4.....n n n n ng p p n       , la ecuación (c’) se puede 
escribir como: 
1n ng g  , 1n  
Ahora, si ng  c (constante) y considerando a (d), resulta que 1 0g c  . Por lo tanto, 
0,ng  n . 
Asumiendo que n >0, entonces, 
 
1
1
,nn n
n
p p




 0n  
por lo que: 
 
0 1 1 0 2 1 0 1 1 0
1 0 2 1 0 3 0 0
1 2 2 1 3 2 1 2 1
, , , .... , , 1nn
n
p p p p p p p p p n
         
         

         ...(e) 
 
son las soluciones que dependen del término 0p , i.e., la probabilidad de que el sistema 
se encuentre en el estado 0E . 
Puesto que 0p está determinado por la condición: 
0 1 2
0
.... 1n
n
S p p p p


     
 
Sustituyendo (e) en la ecuación anterior, se tiene que: 
0 1 0 2 1 0 1 1 0
0
1 2 1 3 2 1 2 1
1 ..... .... 1n
n
p
        
        

  
 
       
 
 
 
 
 
 Capítulo II .Procesos estocásticos 35 
 
 
La probabilidad en el estado estacionario existe si: 
 
 
 
 
donde n y n son no negativos. Si la serie S converge, entonces 0
1
0
S
p  > , i.e., se 
obtiene la probabilidad de que el sistema se encuentre vacío. 
 
Para un sistema de colas, lo anterior significaría que, en algún momento del tiempo, se 
atienden a todos los usuarios que han ingresado al sistema. En caso contrario, querría 
indicar que la serie S diverge, por lo que el sistema no encontraría estabilidad, i.e., 
llegarían más rápido los usuarios, en promedio, de lo que podrían ser servidos (en 
realidad, esto llega a ocurrir en ocasiones). 
 
En los sistemas de colas de la vida real, se puede asumir que las probabilidades de un 
estado estacionario  np existen, si sólo si, la serie S converge y se obtiene de la 
manera mostrada en (e), con 0
1
p
S
 . 
 
Una forma intuitiva de derivar las ecuaciones en diferencias de estado estacionario [(c) y 
(d)], es a través del uso de diagramas de tasas de transición de estados, los cuales 
gráficamente ilustran los postulados de los sistemas de nacimiento y muerte (N-M). Una 
representación sería: 
 
 
 
 
El diagrama representa un estado nE como un círculo etiquetado (por ejemplo, con una 
n ). Las flechas indican las transiciones permitidas, que a su vez son etiquetadas con 
las tasas de transición correspondientes, ya sea de nacimiento ( ) o muerte ( ) . 
 
0 1 0 2 1 0 1 1 0
1 2 1 3 2 1 2 1
1 ..... .....n
n
S
        
        

         <
 
 
 Capítulo II .Procesos estocásticos 36 
 
 
El principio de las ecuaciones de balance o ecuaciones de equilibrio está dado por la 
siguiente expresión: 
Tasa de flujo entrante = Tasa de flujo saliente 
 
 
Si un sistema de N-M alcanza un estado o condición de equilibrio, entonces para cada 
estado en el sistema n ( 0,1,2,3....)n  , la tasa media de flujo de la población entrante 
a un estado debe ser igual a la tasa media de flujo de salida de dicho estado. A las 
expresiones resultantes se les conoce con el nombre de ecuaciones de balance. 
 
De esta manera, dado el estado nE , donde 1n  , la tasa media de flujo de entrada es 
equivalente a 1 1 1 1n n n np p     mientras que la tasa media de flujo de salida es 
equivalente a ( )n n n n n n np p p      con 1n  . Debido al principio de las 
ecuaciones de balance, se tiene que: 
 
 
1 1 1 1 ( )n n n n n n np p p         
 
o 
1 1 1 10 ( ) , 1n n n n n n np p p n           
 
que es justamente la ecuación (c) anteriormente expresada. 
 
2.5 Las distribuciones Poisson y exponencial 
 
Las características de operación de los sistemas de colas están determinadas en gran 
parte por dos distribuciones: la que describe las llegadas o arribos al sistema y la 
asociada al servicio. Es común utilizar las distribuciones Poisson y exponencial para 
explicar respectivamente los fenómenos antes referidos, sin embargo, no son las únicas 
funciones posibles, aunque son muchos los problemas reales para los cuales aplican de 
manera adecuada. 25 . 
 
A continuación se presentan las características de estas distribuciones y los beneficios 
que ofrecen en su aplicación. 
 
 
 
 
 Capítulo II .Procesos estocásticos 37 
 
 
2.5.1 La distribución Poisson 
 
Se dice que una variable aleatoria (v.a.) es Poisson con parámetro >0, si X tiene 
puntos masa 0,1,2,3,… y si la función de masa de probabilidades ( ; )p  está dada por 
 ( ; ) ,
!
k
p k P X k e
k
  
 
    
 
 0,1,2,...k  
la función es no negativa para todos los valores de k y además, 
0 0
( ; ) 1
!
k
k k
p k e e e
k
  
 
 
 
    . 
Su función generadora de momentos está dada por: 
 
( 1)
0 0 0
( )
( ) ( ) exp ( 1)
! !
k k
k k e e
k k k
e
e p k e e e e e e e
k k
 

          
  
   
  
           
 
 De aquí que 
  ;E X   Var X  . 
 
Para un número importante de variables aleatorias de interés en las ciencias de la 
computación y otras áreas, se ha encontrado aplicación de esta distribución. Cuenta 
con una relación importante con otras distribuciones; por ejemplo, en referencia a la 
distribución binomial, la distribución Poisson es el caso límite de ésta. De igual forma, 
en el estudio de fenómenos de arribo, se complementan de forma que si una describe el 
cómo ocurren los eventos, la otra describe lo que ocurre entre dichos eventos; esto se 
comenta a continuación. 
2.5.2 La distribución exponencial 
 
Si T es una variable aleatoria que representa los tiempos entre llegadas o bien, el 
tiempo de servicio en un sistema de colas -donde las ocurrencias representan los 
extremos en los tiempos, ya sean servicios completados o bien, arribos de usuarios-, 
entonces T tiene asociada una función de densidad: 
 
, 0
( )
0, 0
t
T
e t
f t
t


 
 
 <
 
 
 
 Capítulo II .Procesos estocásticos 38 
 
 
y la función de distribución acumulada correspondiente es : 
 
 Pr 1 ,tT t e    0t 

Otros materiales