265-ice

•

IPN

Todos los Materiales

21/10/2022

¡Este material tiene más páginas!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Introducción al Derecho I

137.012 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

INSTITUTO POLITÉCNICO NACIONAL

Escuela Superior de Ingeniería Mecánica y Eléctrica
Unidad “Culhuacan”

Ingeniería en Comunicaciones y Electrónica

SEMINARIO DE TITULACION
“PROCESAMIENTO DIGITAL DE SEÑALES”

“Telefonía IP y Pruebas de Calidad de Audio (QoS)”

T E S I N A
Que para obtener el titulo de:

Ingeniero en Comunicaciones y Electrónica

Presenta:
Vargas Bonilla Héctor Ricardo

Asesores: M. en C. Orlando Beltran Navarro
M. en C. Braulio Sanchez Zamora

México D.F. Noviembre 2009

2
INSTITUTO POLITÉCNICO NACIONAL
ESCUELA SUPERIOR DE INGENIERÍA MECÁNICA ELÉCTRICA
UNIDAD CULHUACAN

TESINA

Que para obtener el título de: INGENIERO EN COMUNICACIONES Y
ELECTRONICA

Por la opción de titulación: SEMINARIO DE TITULACIÓN
“PROCESAMIENTO DIGITAL DE
SEÑALES”

Deberán desarrollar: Héctor Ricardo Vargas Bonilla

INTRODUCCION

En los últimos años ha habido una revolución en lo que al mundo de las
comunicaciones se refiere, este gran cambio está relacionado con la telefonía que ha
logrado que el planeta entero se mantenga comunicado hace ya más de 150 años,
cuando el italiano Antonio Meucci inventó el teléfono. Hablamos de emigrar de una
tecnología de conmutación de circuitos a una de conmutación de paquetes, en otras
palabras, usar las redes de datos para la transportación de voz y así lograr que tanto voz
y datos converjan en una sola red.

En esta tesis se revisaran los temas más relevantes de la Telefonía IP así como
las pruebas realizadas con el objetivo de obtener mediciones del nivel de calidad tanto
de la telefonía convencional como de la IP y darnos una idea que tanto ha avanzado la
transmisión en tiempo real en las redes de datos.

CAPITULO I - Introducción a la Tecnología VoIP
CAPITULO II - Nuevos Servicios y Nuevas Alternativas
CAPITULO III - Evolución de las Redes Telefónicas
CAPITULO IV - Descripción de un Sistema de Comunicación de VoIP
CAPITULO V - Planteamiento de mi Desarrollo
CAPITULO VI - Reporte y Análisis de Resultados

_______________________________ _____________________________
M. en C. Orlando Beltrán Navarro M. en C. Braulio Sánchez Zamora
Coordinador del seminario Asesor

________________________________
Ing. Ignacio Monroy Ostria
Jefe de carrera de ICE

3
Agradecimientos:

A mi Madre, me has enseñado que con esfuerzo, trabajo y perseverancia puedo lograr
cualquier meta que me proponga y esto lo has hecho a través de la única forma en la
que es posible enseñar algo tan grande e importante, el ejemplo. He sido testigo de tu
crecimiento y de tu lucha día a día por lograr una vida mejor para ti y los tuyos.
Eres el pilar de mi vida y tu eres a quien debo todos mis logros. Agradezco
infinitamente a la vida por darme la madre que tengo, por darme a la mejor y más
grande maestra, y sin duda alguna, la más importante de mi vida.

A mi hermana Mayra, una parte muy importante de que mi hermano y yo seamos
personas de éxito hoy en día te lo debemos a ti, tu junto con mi mamá hicieron de este
par de niños, dos adultos de bien, honestos y trabajadores.
Eres una de las personas más fuertes que conozco (si no es que la mas fuerte) y he
aprendido a través de ti que cuando la vida te tira, hay que tener la fuerza suficiente para
levantarse y volverlo intentar. Agradezco inmensamente los sacrificios que pudiste
haber hecho por mi hermano y por mí y estoy seguro que la vida te recompensara
porque esta historia simplemente no hubiera sido posible sin ti.

A mi hermano Edgar, no imagino una vida sin ti y doy gracias por que hayas llegado a
este mundo donde has y seguirás llenando de alegría a muchas personas, porque eso
eres, la alegría de nuestras vidas.
La inteligencia no se basa en el desempeño académico o profesional, si no en
conocernos y no ir en contra de nosotros mismos, simplemente SER y así lograr la
felicidad, en base a esto, eres la persona más inteligente que conozco y en muchos
sentidos mi modelo a seguir.

A todas las personas que de uno u otra forma hicieron de esta tesis una realidad, y
en general a todos aquellos que han sido participes de mi desarrollo tanto profesional
como personal, la vida siempre nos envía a las personas indicadas y todos dejan
enseñanzas en nosotros.
Al Instituto Politécnico Nacional, la institución más querida e importante en mi vida,
la esperanza de cientos de miles de mexicanos que nos da acceso a una educación de
calidad, que nos abre ventanas a una mejor vida y nos permite tener una visión diferente
de la vida.

GRACIAS.

4
Índice

Justificación……………………………………………………………………… 7
Hipótesis.................................................................................................................. 8
1 Introducción a la Tecnología VoIP 8
1.1 Revisión de conceptos sobre las Redes de Datos……………………………. 8
1.1.1 Señalización…………………………………………………………..... 8
1.1.2 Direccionamiento……………………………………………………….. 9
1.1.2.1 Resolución de direcciones………….………………………………. 9
1.1.3 Encaminamiento………………………………………………………… 10
1.2 Modelos de Voz sobre redes de paquetes……………………………………. 11
1.2.1 Voz sobre ATM (VoATM)….………………………………………….. 11
1.2.1.1 Señalización en VoATM….……………………………………….. 12
1.2.1.2 Direccionamiento en VoATM……….……………………………… 13
1.2.1.3 Encaminamiento en VoATM……………………………………….. 14
1.2.1.4 VoATM y el Retardo…….………………………………………… 14
1.2.1.5 Resumen VoATM…………………………………………………... 14
1.2.2 Voz sobre Frame Relay (VoFR)………………..……………………….. 14
1.2.2.1 Señalización en VoFR………………………………………………. 15
1.2.2.2 Direccionamiento en VoFR…….…………………………………… 15
1.2.2.3 Resumen VoFR………………………….………………………….. 16
1.3 Voz sobre IP (VoIP)……………….................................................................. 16
1.3.1 Definiciones…………………………………………………………….. 18
1.3.2 Historia de VoIP……………………………………………………….. 18
1.3.3 Escenarios de VoIP……………….……………………………………… 20
1.3.4 Razones para preferir VoIP........................................................................ 21
1.3.5 Retos para VoIP………………………….………………………………. 22
1.4 Protocolo IP…………………………………………………………………. 22
1.4.1 Encabezado IP………………………………………………………….. 22
1.4.2 Direccionamiento IP…………………..………………………………… 23
1.5 Factores de VoIP y Calidad de Servicio…………………………………….. 24
1.5.1 Periodo de Empaquetamiento y Consideraciones de Ancho de Banda… 24
1.5.2 Retardo (Latencia)……………………………..……………………….. 25
1.5.3 Jitter…………..…………………………………………………….…… 26
1.5.4 Pérdida de paquetes….………………………………………………..… 26
1.5.5 Codecs, MOS y PESQ…………………………………………………… 27
1.5.6 Supresión de Silencio, Ruido Confortable y VAD….………………….. 31
1.5.7 DiffServ y ToS………………….……………………………………….. 31
2 Nuevos Servicios y Nuevas Alternativas 33
2.1 Protocolos de VoIP……………..…………………………………………….. 33
2.2 Modelo de red y protocolos………….………………………………………. 36
2.3 El plano de datos: RTP/RTCP…………………………..…………………… 38
2.3.1 UDP/TCP: el dilema continuidad-fiabilidad………………………..…… 38
2.3.2 La necesidad de herramientas complementarias…..……………….……. 40
2.3.3 RTP: El protocolo de tiempo real………….……………………….……. 42
2.3.3.1 Características de RTP……………………………………..……….. 42
2.3.3.2 Descripción del protocolo RTP……………...……………………… 44
2.3.3.3 Pequeño léxico de los términos RTP………………….…………….. 46
2.4 RTCP: El protocolo de control de transporte de tiempo real…………………. 50
2.4.1 Principios básicos…………………………………………………….….. 50
5
2.4.2 El formato de los paquetes RTCP……………………………….……… 51
2.4.3 Limitación del ancho de banda…………………………………….…… 51
2.4.4 La actualización del número de participantes……………………………. 52
2.4.5 Asignación del ancho de banda para la descripción de fuente SDES….. 532.5 El plano de control…………………………………………………………… 53
2.6 El estándar H.323…………………………………….……………………….. 55
2.6.1 Elementos de la arquitectura H.323…………….………………………. 56
2.6.2 Arquitectura de protocolos H.323………….…………………………… 58
2.6.3 Escenarios de llamada en H.323……..………………………………….. 59
2.6.3.1 Escenario 1: Llamada básica sin Gatekeepers…….………………… 59
2.6.3.2 Llamadas PC-a-teléfono…………………………………….…….… 65
2.6.4 H.323 sobre varios dominios……………………..……………………... 71
2.6.4.1 Modelo de llamada directa…………………………………………. 72
2.6.4.2 Modelo de llamada enrutada…………………………..……………. 72
2.7 H.323 versión 2………………………………………………………………. 74
2.7.1 Tiempo de establecimiento de la llamada………………………………... 74
2.7.2 Mensajes generados por la red..…………………………………………. 74
2.7.3 Procedimiento rápido de establecimiento de conexión
(Fast Setup procedure)…………………………………………………..75
2.7.4 Túneles H.245……………………….…………………………………… 77
2.7.5 Vuelta al procedimiento normal…………………..…………….……….. 78
2.8 DTMF……………………………………………………….……………….. 79
2.9 Fax…………………………………………………………………….…….... 81
2.9.1 Breve descripción de la tecnología G3 para el envío de fax………….… 81
2.9.2 Transmisión de fax sobre IP (T.38 y T.37)………………….…………… 85
2.10 Algunas características de H.323v3………………………….……………… 88
2.11 Protocolo SIP………………….…………………………………………… 88
2.11.1 Atributos de SIP………………………………………………………. 90
2.11.2 Componentes del Sistema………………………..…………………….. 91
2.11.3.1 Sintaxis de una Dirección SIP……………….……….…………… 93
2.11.3.2 Soporte SIP para Direcciones E.164….…………………………… 93
2.11.3.3 Soporte de la Movilidad………………………………………….… 94
2.11.4 Estructura de los Mensajes SIP…………………….………………….... 95
2.11.4.1 Línea de partida…..…………………………………………….. 95
2.11.4.1.1 Peticiones SIP……………………………………..……..… 95
2.11.4.1.2 Respuestas SIP……………………………………………… 96
2.11.4.2 Cabeceras SIP……………………….……………….…………. 98
2.11.4.2.1 Abreviaciones de los Nombres de las Cabeceras…...…… 102
2.11.4.3 Cuerpo de los Mensajes SIP………………………….……… 103
2.11.4.3.1 Protocolo de Descripción de Sesión
(SDP – Session Description Protocol)……………………. 103
2.11.5 Escenarios con SIP...………………………………………………….... 105
2.11.5.1 Llamada directa SIP entre puntos finales IP………..…………….. 105
2.11.5.2 Llamada directa SIP entre dos Gateways VoIP………..………….. 108
2.11.5.3 Registro de Cliente con un Servidor de Registro SIP…….……….. 109
2.11.5.4 Actualización de Cliente con un Servidor de Registro SIP……..… 109
2.11.5.5 UAC redirigido hacia un Proxy Server…………………….……… 110
2.11.5.6 Modificación de una llamada SIP…………………………………. 110
2.12 SIP y H.323…………………………………………………………………. 111
2.12.1 ¿Qué hace SIP y qué no hace H.323?....................................................... 111
6
2.12.2 Futuro de SIP y su relación con H.323………………………..……….. 112
2.13 SIP para telefonía: SIP-T…………………………………………………… 112
2.13.1 Introducción……………….…………………………………………... 112
2.13.2 SIP-T para las interconexiones PSTN-IP……………………….……... 113
2.13.3 Configuraciones con SIP-T……………………………………..……… 115
2.13.3.1 Roles fundamentales en SIP-T……………………………………. 117
2.13.3.1.1 Origen…………….….……………………………………….. 117
2.13.3.1.2 Terminador……………………………………………………. 118
2.13.3.1.3 Proxy……………….…………………………………………. 118
2.13.4 Componentes de la propuesta SIP-T……………………..………..…… 118
2.13.5 Negociación de los Contenidos SIP………………………….………... 119
2.14 Protocolo MEGACO (Media Gateway Control Protocol)………….……… 121
2.14.1 ¿Por qué un nuevo protocolo?.................................................................. 121
2.14.2 ¿Una nueva arquitectura para la telefonía IP?......................................... 123
2.14.3 Descripción de MEGACO………………………….……………….… 124
2.14.3.1 Funciones de MEGACO……........................…………………….. 127
2.14.3.2 Modelo de conexión……………………………………………….. 128
2.14.3.3 Comandos de MEGACO…………………………………………. 129
2.14.4 Escenarios MEGACO……………………………………………….…. 130
2.14.4.1 Llamada entre usuarios con gateways residenciales……………….. 130
2.14.4.2 Llamada entre usuarios con trunking gateways …………………… 132
3 Evolución de las Redes Telefónicas 136
3.1 Introducción a los Sistemas Telefónicos……………………………….……. 136
3.2 Conmutación y Multiplexaje en Telefonía Digital………….…………….… 137
3.2.1 Conmutación Telefónica……………..…………………………………. 137
3.2.2 Multiplexaje en Telefonía Digital…………………..…………………… 138
3.2.2.1 Modulación por codificación de pulsos (PCM)……………………... 138
3.2.2.2 Multiplexaje por División en el Tiempo…………….……………… 139
3.2.2.3 Jerarquía PDH………………………………………………………. 139
3.2.2.4 Jerarquía SDH….…………………………………………………... 141
3.3 Señalización SS7………………………….…………………………………. 143
3.3.1 Capas de SS7……………………….…………………………………… 143
3.3.2 Estructura de la red SS7…………………………………………………. 145
3.4 ESTADÍSTICAS Y CIFRAS IMPORTANTES…………………………….. 145
4 Descripción de un Sistema de Comunicación de VoIP 155
4.1 Esquema……………………………………………………………….…….. 159
5 Desarrollo de las pruebas de Audio 160
5.1 Pruebas de Calidad de Audio Tanto en telefonía Convencional
(PSTN) Como en telefonía IP (VoIP)…………………………………….……… 160
6 Reporte y Análisis de Resultados 164

Conclusiones……………………………………………………………………… 170
Bibliografía……………………………………………………………………….. 173
Índice de Figuras.………………………………………………………………… 175
Índice de Tablas………………………………….………………………………. 177

7
Justificación

En los últimos años ha habido una revolución en lo que al mundo de las
comunicaciones se refiere, este gran cambio está relacionado con la telefonía que ha
logrado que el planeta entero se mantenga comunicado hace ya mas de 150 años,
cuando el italiano Antonio Meucci inventó el teléfono. Hablamos de emigrar de una
tecnología de conmutación de circuitos a una de conmutación de paquetes, en otras
palabras, usar las redes de datos para la transportación de voz y así lograr que tanto voz
y datos converjan en una sola red.

Ya que Internet no fue diseñado para transmitir en tiempo real, se tuvieron que
hacer varias adecuaciones para lograr que la voz viaje sin problemas y en tiempo real a
través de la red IP, a esto se le conoce como Voz sobre Internet o VoIP por sus
acrónimos en ingles.

Existen varias compañías alrededor del mundo que ya ofrecen este servicio,
dentro de las mas importantes se encuentran: Alestra, Avantel, AT&T, Avaya, Mitel,
entre otras. Dentro de estas se manejan dos grandes tendencias, las compañías que en
sus principios manejaban la telefonía tradicional y posteriormente incorporaron a sus
sistemas la telefonía IP y las que inicialmente fueron compañías de telefonía IP y
después incorporaron la telefonía tradicional. Estadísticamente las compañías que están
dentro de la primera tendencia mencionada son las que han tenido menos fallas y han
logrado con mayor éxito la convergencia de estas dos redes.

Actualmente la Red Telefónica Publica Conmutada (Public Switching
Telephone Network, PSTN) se encuentra brindando servicios de telefonía de buena
calidad alrededor del mundo, es por esto que se podría generar la siguiente pregunta,
¿Por qué cambiar algo que funciona y funciona bien?, el emigrar de una telefonía
convencional a una Telefonía IP tiene varias ventajas. La primera y una de las mas
importantes, se eliminan los costos de larga distancia, ya que la voz viaja a través de las
redes de datos, todas las llamadas convergerían en esta nube mundial que es el Internet.
Otra ventaja importante es la de contar con un mayor número de servicios, ya que los
datos y la voz viajan a través de la misma red, estos se pueden complementar
mutuamente y así lograr nuevos servicios comoson: Videoconferencias, video bajo
demanda, respuesta de voz interactiva (Interactive Voice Response, IVR),
Telemedicina, etc. Las ventajas son numerosas y aunque podamos mencionar todas y
cada una de ellas podríamos resumirlas en lo siguiente: Más y mejores servicios a
menores costos para el usuario final. Con esto no quiero decir que todo sea “Miel sobre
hojuelas”, el gran sacrificio que se debe hacer, al emigrar de un sistema PSTN a uno de
VoIP es la Calidad de Servicio o QoS (Quality of Service, por sus siglas en Ingles). Por
esta razón, en esta tesis se realizaron pruebas de calidad del Audio en cada uno de los
sistemas antes ya mencionados.

Es por esto que la telefonía IP ha tenido un crecimiento acelerado en los últimos
años alrededor del mundo. En lo que concierne a nuestro país es necesario mencionar
que este crecimiento no ha sido tan grande como el de países tecnológicamente más
avanzados como es el caso de Japón, que es el país que cuenta con el mayor numero de
suscriptores de telefonía IP en el mundo. En México la inversión que experimentó este
sector de las comunicaciones (Gral.) en el 2007 fue de 2,548 millones de dólares y en el
2008 la suma ascendió a 2,677 millones de dólares. Y por supuesto la cantidad de
8
ingresos fue mucho mayor que la de inversión, en el 2007 fue de 267,874 Millones de
Pesos y en el 2008 fue de 275,594 Millones de Pesos (FUENTE: Reporte de ingresos e
inversión en la industria de Telecomunicaciones. Dirección de Información Estadística
de Mercados, COFETEL).

En la actualidad se calcula que el 40% de las líneas telefónicas existentes son
líneas IP y se estima que para el año 2011 la cifra aumente a un 70%. Con esto no
quiero decir que la telefonía IP vaya a desplazar a la telefonía convencional en un corto
plazo. Estas 2 grandes redes de comunicación tienen que coexistir (convivir) en la
actualidad y por un lapso de tiempo aun considerable. Esto debido a que toda la
infraestructura existente de la Red Telefónica Publica Conmutada no puede ser
desechada de un día para otro, es mas, la telefonía IP depende hoy en día de dicha
infraestructura para así poder tener un mayor alcance dentro de la población.

Dado este escenario, esta tesis está enfocada a presentar los elementos relevantes
de la telefonía IP para su conocimiento y manejo en el contexto del análisis de la etapa
de transición que vive México en la actualidad con respecto a la migración de una
Telefonía convencional a una IP.

En el presente trabajo también se mostrará como se encuentra conectada, y que
equipos ocupa, una pequeña red de VoIP en un laboratorio de una de las compañías mas
grande de comunicaciones en nuestro país, para ejemplificar de una forma mas clara con
que tecnología cuenta nuestro país y en que etapa de esta transición nos encontramos.

Hipótesis
Es posible realizar pruebas MOS (resultado de opinión media) tanto para telefonía IP
como para la telefonía convencional (PSTN), con el objetivo de comparar los resultados
y así saber la calidad de servicio que ofrece VoIP con respecto a la PSTN.

CAPITULO I. Introducción a la Tecnología VoIP.
1.1 Revisión de conceptos sobre las Redes de Datos

Las comunicaciones de datos, al igual que las de voz, se basan en la
señalización, el direccionamiento y el encaminamiento para transportar información de
la fuente al destino.
1.1.1 Señalización
Cualquier discusión sobre señalización debe hacer notar las diferencias en
comportamiento de las redes orientadas a conexión frente a las no orientadas a
conexión.

Redes orientadas a conexión
Una conexión es un camino lógico entre las estaciones finales fuente y destino.
El término circuito virtual (VC) se utiliza a menudo para describir este tipo de conexión.
Ejemplos de circuitos virtuales son las conexiones establecidas en una red ATM
utilizando circuitos virtuales permanentes (PVCs).

9
Para establecer una conexión se necesitan una ruta y unos requisitos para dicha
conexión. Los requisitos de una conexión son un conjunto de peticiones que la estación
final hace a la red. Por ejemplo, en una red ATM, una petición de circuito virtual puede
especificar una tasa de datos media, una tasa de datos máxima y un porcentaje de
pérdida de datos. La red intentará construir el VC especificado, si es que hay recursos
disponibles.
Redes no-orientadas a conexión
Al contrario que las redes orientadas a conexión, las redes no-orientadas a
conexión no necesitan sesiones de establecimiento y liberación de conexiones. Los
encaminadores de estas redes aceptan todo el tráfico e intentan enviarlo basándose en la
filosofía “best-effort”. Los encaminadores pueden priorizar el tráfico, pero no tienen un
conocimiento global sobre el estado de la red.

Algunos protocolos de redes no-orientadas a conexión, como RSVP (Resource
Reservation Protocol) comunican los requisitos de sesión al núcleo de la red a la manera
en que los requerimientos de una conexión se comunican en una red orientada a
conexión. [1]
1.1.2 Direccionamiento
Los arquitectos originales de Internet diseñaron un protocolo y un esquema de
direccionamiento que hiciera abstracción de las tecnologías subyacentes. Esta
interoperabilidad permite a los usuarios comunicarse unos con otros sin tener en cuenta
la red a la que están conectados. Por ejemplo, el esquema de direccionamiento y los
protocolos TCP/IP permiten a un usuario en una estación Ethernet comunicarse, a través
de una red X.25, con otra estación final en una LAN Token Ring.

Si se utiliza IP como ejemplo de direccionamiento de Nivel 3, lo que destacan
son los conceptos de red y de host. Este esquema de direccionamiento incrementa la
flexibilidad y la escalabilidad de las redes de datos. Ejemplos de aproximaciones a
direccionamientos por niveles los hay tanto en redes de área local como de área amplia.
Es importante destacar que los esquemas de direccionamiento por niveles presentan
grandes diferencias frente a los esquemas de direccionamiento utilizados en las redes de
voz.
1.1.2.1 Resolución de direcciones
Es importante destacar cómo se traducen las direcciones de Nivel 3 a direcciones
de Nivel 2, ya que este concepto es ajeno a las redes de voz. Existen tres métodos
diferentes de traducción o resolución de direcciones:
• Difusión (Broadcast)
• Servidores de resolución de direcciones
• Tablas de configuración locales

Difusión (Broadcast)
En las redes que comparten un medio común, una aproximación evidente es la
utilización de los mecanismos de difusión. En este caso, cuando una estación conoce la
dirección de destino IP pero no la dirección Ethernet subyacente a dicha dirección IP de
destino, la propia estación fuente difunde una petición dirigida a todos los que
comparten dicho medio. Todos los nodos recibirán el mensaje pero sólo una estación, la
propietaria de la dirección IP que se quiere resolver, responderá a la fuente con su
dirección Etehrnet.
10

Servidores de resolución de direcciones
El mecanismo de difusión es muy eficiente en LANs no-orientadas a conexión, y
con medio compartido, pero no es adecuada en redes orientadas a conexión. En el caso
de ATM, se utiliza un servidor para resolver la dirección ATM a una dirección IP en lo
que se conoce como “Classical IP over ATM”. Todas las peticiones de direcciones
desconocidas de nodos ATM se dirigirán al servidor de direcciones que responderá con
la dirección subyacente ATM correcta. Después de recibir esta dirección subyacente
ATM, la fuente se comunica directamente con la estación de destino.

Tablas locales de configuración
Las redes pequeñas pueden ahorrarse cualquiera de los dos tipos anteriores de
resolución de direcciones si en cada estación final se configuran tablas locales que
contengan las correctas asociaciones de direcciones de Nivel 3 y direcciones de Nivel 2.
1.1.3 Encaminamiento
La determinación de una ruta consiste en el proceso de encontrar el “mejor”
camino desdela estación fuente a la estación destino. El encaminamiento se utiliza tanto
en protocolos de Nivel 2 como de Nivel 3. Para determinar una ruta es posible la
utilización de tablas estáticas pre-programadas en cada conmutador o en cada
encaminador, así como la utilización de protocolos de encaminamiento dinámico.

1.2 Modelos de Voz sobre redes de paquetes
Todos los sistemas de voz paquetizada siguen un modelo común, según se
muestra en la Figura 1-1

Figura 1-1: Modelo de redes de voz paquetizada

La red de transporte de voz paquetizada puede estar basada en IP, Frame Relay
o ATM. Las fronteras de dicha red son equipos que denominaremos “Agentes de voz”.
La misión de estos equipos es cambiar la información de voz desde su forma tradicional
telefónica a un formato adecuado para su transmisión en paquetes. La red podrá
entonces dirigir los paquetes de voz hacia otros agentes de voz de destino.

Red de datos y voz
paquetizada
Agente de
voz
Agente de
voz
Agente de
voz
PBX
11
Existen dos modelos básicos para la integración de la voz sobre los datos,
Transporte frente a Traducción. El modelo de Transporte supone el soporte transparente
de la voz sobre las actuales redes de datos. Un buen ejemplo es la simulación de líneas
dedicadas sobre ATM utilizando la emulación de circuitos.

La Traducción supone que la infraestructura de datos es capaz de soportar las
funciones de voz tradicionales. Por ejemplo, la interpretación de la señalización de voz
en las redes de datos actuales y la creación de conexiones virtuales conmutadas (SVCs)
con ATM. Las redes que sigue este modelo de Traducción son mucho más complejas
que las que siguen el modelo de transporte y su implementación está en plena discusión
en varios comités de estandarización. [1]

Figura 1-2: Modelos de Conectividad/Señalización
1.2.1 Voz sobre ATM (VoATM)
El ATM Forum y el ITU especifican diferentes clases de servicio para
representar los diferentes tipos de tráfico posibles.

Primeramente diseñados para comunicaciones de voz, las clases CBR (Constant
Bit Rate) y VBR (Variable Bit Rate) se utilizan en el tráfico de tiempo real, y garantizan
un cierto nivel de servicio. El parámetro CBR, en particular, permite especificar,
durante el establecimiento de la llamada, el ancho de banda, el retardo extremo a
extremo y la variación permitida de dicho retardo.

Los parámetros UBR (Unespecified Bit Rate) y ABR (Available Bit Rate) son
más apropiados para aplicaciones de datos. En particular, UBR no garantiza la entrega
del tráfico de datos.

El método de transporte de canales de voz sobre redes ATM depende de la
naturaleza del tráfico. Se han especificado varios tipos de adaptación a ATM, cada uno
de ellos con sus ventajas y desventajas. La Capa de Adaptación AAL 1 es el método
más utilizado con servicios CBR.

AAL1 no estructurado toma un flujo continuo de bits y lo coloca en celdas
ATM. Se trata de un método de adaptación muy utilizado para soportar un flujo E1 de
extremo a extremo. El problema que presenta es que hay que enviar el flujo E1
completo, sin tener en cuenta la cantidad actual de canales de voz en uso dentro de él.
AAL1 estructurado dispone de un puntero en la carga útil (payload) que permite
PBX 1
PBX 2
PBX 3
PBX 4
PBX 1
PBX 2
PBX 3
PBX 4
12
mantener la estructura DS0 en las celdas ATM. Este método permite una mayor
eficiencia ya que no consume ancho de banda para canales E0 no utilizados. La opción
de remapping permite a las redes ATM reunir las celdas estructuradas AAL1 y redirigir
los canales DS0 hacia los destinos adecuados. Esto elimina la necesidad de conexiones
virtuales permanentes (PVCs) entre cada posible combinación fuente-destino. La
principal diferencia con el método no estructurado es que no hace falta construir PVCs a
lo largo de la red entre frontera y frontera de la red.
1.2.1.1 Señalización en VoATM
La Figura 1-3 describe el método de Transporte, en el cual, la señalización de
voz es transportada transparentemente por la red.

Figura 1-3: Señalización VoATM, Modelo de Transporte
En este modelo, hay que crear diferentes PVCs para el transporte transparente de
la voz y de la señalización. Primero, los mensajes de señalización son transportados
transparentemente sobre la PVC denominada “Señalización no-ATM”, desde una
estación final a otra. Después, la coordinación entre los sistemas finales permitirá la
selección de otra PVC para transportar la voz entre ellos.

Como puede deducirse fácilmente, la red ATM no participa en ningún momento
en la interpretación de la señalización que tiene lugar entre las estaciones finales. Sin
embargo, como característica de valor añadido, puede destacarse que algunos equipos sí
son capaces de entender la señalización CAS (señalización en canal asociado) y pueden
evitar el envío de celdas vacías de voz cuando las estaciones finales han “colgado”.

En contraste, la Figura1-4 muestra ahora el modelo de Traducción (Translate
model).

Figura 1-4: Señalización VoATM, Modelo de Traducción
Red no ATM Red no ATM
Red ATM
SVC de voz
SVC de voz
PVC de
señalización
no ATM
PVC de
señalización
no ATM
Red no ATM Red no ATM
Red ATM
PVC de voz
PVC de voz
PVC de
señalización
no ATM
PVC de
señalización
no ATM
13
En este modelo, la red ATM interpreta la señalización tanto desde los equipos
no-ATM como desde los ATM. Se crearán conexiones virtuales permanentes (PVCs)
entre las estaciones finales y la red ATM. Recordemos que en el modelo de Transporte,
las PVCs se transportan transparentemente por la red ATM.
Una petición de señalización desde una estación final provocará que la red ATM
cree un circuito virtual conmutado (SVC) con la calidad de servicio (QoS) apropiada,
dependiendo de los deseos de dicha estación final. La creación de una SVC, frente a las
PVCs del modelo anterior, ofrece más ventajas desde tres puntos de vista:

• Las SVCs utilizan más eficientemente el ancho de banda.
• Los criterios de QoS no necesitan ser constantes; en las PVCs debían mantenerse
constantes.
• La posibilidad de conmutación de las llamadas dentro de la red ATM pude llevarnos
a la sustitución de las PBX de tránsito, e incluso de las de frontera.
1.2.1.2 Direccionamiento en VoATM
Los estándares ATM soportan ambos esquemas de direccionamiento, público y
privado. Ambos esquemas de direccionamiento tienen una longitud de 20 octetos, según
se muestra en la Figura 1-5

Figura 1-5: Direccionamiento ATM

El AFI (Authority and Format Identifier) identifica el formato de
direccionamiento empleado. Actualmente, existen tres identificadores especificados:
DCC (Data Country Code), ICD (International Code Designator) y E.164. Cada uno de
los tres formatos está estandarizado por su comité correspondiente. La segunda parte de
la dirección es el IDI (Initial Domain Identifier), que únicamente identifica la red del
abonado. El esquema E.164 posee un IDI mayor puesto que se corresponde con los 15
dígitos del número ISDN. La parte final, DSP (Domain Specific Part) identifica grupos
lógicos dentro de estaciones finales ATM.

En el modelo de Transporte no es necesario preocuparse del direccionamiento
subyacente de la red de voz. Sin embargo, en el modelo de Traducción, la posibilidad
de comunicar equipos no-ATM con equipos ATM implica un cierto nivel de correlación
de direcciones. Afortunadamente, ATM soporta el esquema de direccionamiento E.164,
el mismo sistema empleado por las redes telefónicas en todo el mundo.
Domain Spacific Part (DSP)
Initial Domain Identifier (IDI)
Data Country Code (DCC) and International Code Designator (ICD)
Domain Spacific Part (DSP)
Initial Domain Identifier (IDI)
AFI
AFI E.164 ATM format
14
1.2.1.3 Encaminamiento en VoATM
ATM utiliza PNNI (Private Network toNetwork Interface), un protocolo de
encaminamiento “enlace-estado” jerárquico que es escalable para uso global. Además
de poder determinar la accesibilidad y el encaminamiento en las redes ATM, también es
posible el establecimiento de llamadas.

Una petición de circuito virtual (VC) provocará una conexión, con ciertos
requerimientos de QoS, hacia la red ATM. La ruta a través de la red se determina por el
conmutador ATM fuente basándose en lo que él determina como “mejor” camino a
través de red, partiendo de la información que obtuvo del protocolo PNNI y de los
requerimientos de QoS. Cada conmutador a lo largo de la ruta es chequeado para
comprobar si dispone de los recursos apropiados para la conexión.

Una vez que la conexión está establecida, el tráfico de voz fluirá entre las
estaciones finales, exactamente igual que si existiese una línea dedicada entre ellas. Es
importante destacar que la especificación PNNI sólo es apropiada en el ámbito de las
redes privadas. Si hablamos de redes públicas, el protocolo entre conmutadores se
denomina B-ICI.
1.2.1.4 VoATM y el Retardo
ATM ofrece diversos mecanismos para el control del retardo y de la variación
del retardo o jittering.

Las capacidades de QoS en ATM permiten especificar peticiones de tráfico de
flujo de bits constante (constant bit rate) con ancho de banda y variación del retardo
garantizados. El uso de conexiones virtuales (VC) permite que cada tipo de tráfico sea
gestionado en colas diferentes y sea tratado con independencia. En el caso del tráfico de
voz, puede utilizarse una cola de alta prioridad para dicha transmisión. Además, la
utilización de pequeñas celdas de tamaño fijo reducirá el retardo en las colas y la
variación en dicho retardo asociada a las longitudes variables de los paquetes. [9]
1.2.1.5 Resumen VoATM
ATM es una arquitectura orientada a conexión. Fue creado para, entre otras
cosas, manejar tráfico sensible al retardo, como la voz. Sus procedimientos de
señalización, direccionamiento y encaminamiento nos permiten la construcción de una
red que siga el modelo de Traducción. La función de encaminamiento, en particular, es
lo bastante “robusta” como para permitir la construcción de conexiones basadas en el
acuerdo previo sobre un cierto retardo y variación del retardo.
1.2.2 Voz sobre Frame Relay (VoFR)
Frame Relay es una tecnología ampliamente difundida, utilizada generalmente
en el ámbito de las redes de datos corporativas por su flexibilidad en la utilización del
ancho de banda, accesibilidad a nivel mundial, soporte a mezclas de tráfico diversas y
madurez de la tecnología.

El servicio Frame Relay está basado en la utilización de conexiones virtuales
permanentes (PVCs). VoFR es una progresión lógica para las empresas que ya estaban
utilizando Frame Relay en su transporte de datos.
15
1.2.2.1 Señalización en VoFR
Históricamente, el establecimiento de llamadas con Frame Relay ha sido una
solución propietaria de cada fabricante. Esto ha significado que los productos de
diferentes fabricantes no interoperaran entre sí. El Frame Relay Forum FRF.11
establece un estándar para el establecimiento de llamadas, los tipos de codificación y los
formatos de los paquetes para transmitir voz sobre Frame Relay, y proporcionar la base
para la interoperabilidad futura entre los fabricantes.
1.2.2.2 Direccionamiento en VoFR
La configuración de direcciones se gestiona a través de tablas estáticas: dígitos
marcados se corresponden con PVCs específicas. El encaminamiento de la voz depende
del tipo de protocolo de encaminamiento utilizado para establecer las PVCs y del
hardware utilizado en la red Frame Relay. El encaminamiento puede basarse en límites
de ancho de banda, número de saltos, retardos, o combinaciones de estos criterios, pero
la mayoría de las implementaciones de encaminamiento se basan la maximización de la
utilización del ancho de banda.

Los dos extremos en el diseño de una red VoFR son:

• Una red completamente mallada de PVCs de voz y datos para minimizar el número
de saltos en el tránsito por la red y para maximizar la capacidad para establecer
diferentes calidades de servicio. Una red diseñada de esta forma minimiza el retardo
y mejora la calidad de la voz, pero ejemplifica la red de más alto costo.

• Muchos proveedores de Frame Relay tarifican basándose en el número de PVCs
utilizadas. Para reducir el costo, ambos segmentos de voz y datos pueden
configurarse para que utilicen la misma PVC; reduciendo por tanto el número de
problemas potenciales derivados de la creación de un salto en el tránsito cuando la
voz necesita ir de una oficina remota a la otra. Sin embargo, esto impide la
compresión/descompresión que tiene lugar cuando utilizamos una PBX de tránsito.

Existen mecanismos para minimizar el retardo y la variación del retardo en una
red Frame Relay. La presencia de grandes tramas de datos en un enlace Frame Relay de
baja velocidad puede causar retardos inaceptables para tramas sensibles al tiempo. Para
minimizar este problema, algunos fabricantes implementan tamaños pequeños de tramas
para ayudar a reducir el retardo y la variación del retardo.

Los métodos para priorizar las tramas de voz frente a las de datos también
ayudan a reducir el retardo y la variación del retardo. El problema es que tanto estos
métodos, como los que potencian la utilización de pequeños tamaños de tramas son
soluciones propietarias de cada fabricante. Para asegurar la calidad de la voz, el CIR
(Committed Information Rate) en cada PVC debe establecerse convenientemente para
asegurar que las tramas de voz no serán descartadas.

Frame Relay está bastante difundido y resulta comparativamente asequible.
Además está ampliamente disponible en todo el mundo. Frame Relay tan sólo es una
especificación de interfaz, mientras que ATM y TCP/IP son especificaciones de
arquitecturas. Consecuentemente, es probable que Frame Relay sólo sea utilizado como
mecanismo de transporte.

16
Las redes Frame Relay del futuro proporcionarán señalización SVC para el
establecimiento de llamadas, y pueden permitir, incluso, que los DTEs Frame Relay
hagan peticiones de calidad de servicio para una llamada lo que mejorará la calidad de
la voz sobre Frame Relay. [2]
1.2.2.3 Resumen VoFR
Frame Relay también puede ser utilizado para la paquetización de voz. Es
relativamente barato y se encuentra disponible en prácticamente todo el mundo.
Además, próximamente podrá ofrecer SVCs y soportar QoS. Sin embargo, su carencia
de un completo sistema de señalización, direccionamiento y encaminamiento evitará,
seguramente, la implementación de modelos de Traducción, teniéndonos que conformar
con los de Transporte.

1.3 Voz sobre IP (VoIP)

En la actualidad la Red Telefónica Publica Conmutada (PSTN) se encuentra
brindando servicios de voz de buena calidad y prácticamente instantáneos alrededor del
mundo, es por eso que es el sistema telefónico mas ocupado y el cual ha logrado que el
mundo se mantenga comunicado hace ya mas de 150 años. La red de
telecomunicaciones actual esta basada en la conmutación de circuitos y es ideal para el
servicio telefónico de voz, debido a la demanda del mercado se creó hace 20 años la
RDSI (Red Digital de Servicios Integrados) para manejar voz, datos e imagen, sin
embargo no fue suficiente ya que fue rebasada rápidamente por otra tecnologías y una
de estas tecnologías es las redes de datos basadas en el modelo de conmutación de
paquetes. El cambio necesario es una tecnología que nos ofrezca costos más accesibles
y una mayor gama de servicios.

Una de las grandes alternativas que se ha analizado para lograr este cambio es el
usar las redes de datos para la transportación de señales de voz y para dicho objetivo es
necesario hacer uso del protocolo IP, tecnología conocida como Voz sobre IP o VoIP
por sus siglas en ingles (Voice over Internet Protocol). El crecimiento de la
implantación de las redes IP,tanto en local como en remoto, el desarrollo de técnicas
avanzadas de digitalización de voz, mecanismos de control, priorización de tráfico,
protocolos de transmisión en tiempo real, así como el estudio de nuevos estándares que
permitan la calidad de servicio en redes IP, han creado un entorno donde es posible
transmitir telefonía sobre IP lo que no significará en modo alguno la desaparición de las
redes telefónicas por conmutación de circuitos, sino que habrá, al menos
temporalmente, una fase de coexistencia entre ambas.

La telefonía IP nos presenta un gran numero de ventajas en comparación a la
telefonía tradicional, una de las mas importantes es que no únicamente hablamos de la
transportación de voz, sino que también podemos manejar datos, imágenes y video lo
cual nos arroja un numero importante de servicios con los que puede contar una
telefonía IP, como los son: Música (cualquier tipo de sonido), Respuesta de Voz
Interactiva (IVR), Audio conferencia, Facsímiles, cámaras digitales, equipo medico,
video conferencia, televisión, etc.

Pero, ¿Qué es lo que realmente nos ofrece una telefonía IP?, ¿Por que cambiar si
lo que tenemos funciona bien?. Estamos hablando de una revolución en el mundo de las
comunicaciones y un cambio de esta índole no es fácil de explicar pero su justificación
17
se podría aclarar enunciando ciertas cualidades o ventajas que nos ofrece la telefonía IP,
dentro de las cuales podemos destacar las siguientes:

• Disminución de costos: En una telefonía convencional el usuario al momento de
realizar una llamada telefónica se le asigna un canal exclusivamente para el, en
cambio en la telefonía IP, este canal se divide entre un gran numero de usuarios
y por lo consiguiente el costo disminuye ya que el canal es aprovechado mas
eficazmente. Otra razón es que la voz viaja por una red de datos y no importa la
distancia que recorra, el costo será el mismo, es decir, el usuario final puede
pagar lo mismo por una llamada de larga distancia que por una llamada local.
• Flexibilidad: Es importante recordar que el protocolo IP no depende de la capa
de enlace, lo que permite que el usuario final elije el formato de enlace que mas
le convenga, en otras palabras, el usuario de VoIP puede elegir entre Ethernet,
ATM, Frame Relay, xDSL e inclusive puede transportarse a través de líneas
analógicas.
• Mas y Mejores Servicios: En la telefonía IP se cuenta con los mismos servicios
que se tienen en la PSTN (llamada en espera, correo de voz, fax, etcétera) pero
IP cuenta con servicios que en la telefonía convencional seria imposible de tener
como son: Video conferencias, llamadas vía Web, Video bajo demanda,
Extensiones virtuales, etc. Otra ventaja importante es que el protocolo IP
siempre está en evolución, es decir, constantemente se encuentran aplicaciones
nuevas con las que puede contar.
• Estandarización: Con el gran crecimiento que se ha dado en la telefonía IP en
los últimos años nos hemos visto en la necesidad de crear estándares universales
y esto ha logrado que los principales proveedores de telecomunicaciones en el
mundo fabriquen aparatos apegados a las normas de dichos estándares y esto
conlleva a una completa compatibilidad no importando el fabricante ni modelos,
y esto lleva a la reducción de costos para el usuario final.

Los teléfonos IP han existido originalmente en forma de software corriendo
sobre una PC multimedia para la comunicación de bajo costo de PC a PC sobre Internet.
Los problemas con la calidad del servicio (QoS) asociados con Internet y la plataforma
PC, resultaron ser pobre en la calidad de voz, excesivo retraso, y la congestión en la red
provoca pérdida de paquetes. La QoS proporcionada por Internet continúa mejorando
así como la tecnología está avanzando con enlaces mas rápidos y switches que evitan la
congestión, conexiones de acceso mas rápido de los usuarios tales como xDSL, cortes
de baja latencia y nuevos protocolos como RSVP y MPLS técnicas que dan prioridad a
datos sensibles tales como voz y video.

Además del IP, VoIP utiliza el protocolo Tiempo-Real (RTP) para ayudar a
asegurarse de que los paquetes sean entregados de una manera oportuna. VoIP tiene
como principal objetivo asegurar la interoperabilidad entre equipos de diferentes
fabricantes, fijando aspectos tales como la supresión de silencios, codificación de la voz
y direccionamiento, y estableciendo nuevos elementos para permitir la conectividad con
la infraestructura telefónica tradicional. Estos elementos se refieren básicamente a los
servicios de directorio y a la transmisión de señalización por tonos multifrecuencia
(DTMF). [5]
18
1.3.1 Definiciones
Voz sobre IP (VoIP) puede definirse como una tecnología que permite el
transporte de señales de voz sobre datagramas IP, ofreciendo un servicio al usuario de
comunicación de voz en tiempo real.

Cuando se habla de VoIP, mucha gente piensa en comunicaciones de voz sobre
Internet. Sin embargo, VoIP es una tecnología que puede implementarse en cualquier
tipo de red privada que use el protocolo IP para interconectar sus sub-redes.

No debe confundirse el término VoIP con el de “Voice over Packet”. Con éste
último término nos estamos refiriendo al transporte de voz sobre cualquier red de
paquetes: IP, ATM o Frame Relay.

Aunque la tecnología suele denominarse “Voz sobre IP”, incluye también el
transporte de datos “Multimedia” sobre redes IP. Los estándares de VoIP contemplan
ambos tipos de transporte de datos (por ejemplo, la videoconferencia) ya que los dos
necesitan un servicio de comunicaciones en tiempo real.
1.3.2 Historia de VoIP
Los comienzos de Internet se remontan a 1970. Pronto se convirtió en la
herramienta de trabajo favorita de los investigadores de todo el mundo. Rápidamente
experimentaron la necesidad de comunicarse de un modo más “humano”, más directo.
Para seguir conferencias orales de grupo, implementaron en sus encaminadores el
direccionamiento multipunto, que racionaliza el envío simultáneo de un mensaje a
varios destinatarios. El conjunto de estás máquinas representa la red overlay MBONE
sobre la que se han realizado ya las primeras experiencias de transmisión de video y
audio.

Figura 1-6: Historia de VoIP
1972 198 1991 1992 1993 1994 1995 1996 1997 1998
Time
Tasa de
bits del
64 kbps
G.711
32
kbps
G.726
13 kbps
GSM
16 kbps
G.728
9.6
kbps
(1994)
5.3 & 6.3
kbps
G.723.1
Velocidad
del
Modem
Pentium
600
Pentium
400
Pentium
200
80386
80486
PC
Procesador
9.6 kbps
14.4 kbps
28.8 kbps
33.4 kbps
55.6
kbps
19
Las aplicaciones de telefonía o de difusión de audio para microordenadores
aparecieron a finales de 1994, el año en que Internet explotó en los medios y entre el
público gracias al desarrollo de las páginas web y los “navegadores”. Estas aplicaciones
aprovechan los recursos de las tarjetas de sonido para la digitalización de la señal y su
restitución en forma analógica. Ha sido pues necesario esperar a que el parque de
ordenadores multimedia fuera lo suficientemente amplio como para incitar a los
informáticos a crear nuevas herramientas para el gran público.

Los Procesadores Digitales de Señales (DSP) son los encargados de
proporcionar los recursos necesarios para que los algoritmos de compresión puedan ser
cada vez mas complejos y eficaces, dado que, un canal de telefonía (RDSI) dispone de
una tasa de transferencia de 64 Kbps para el transporte de sonido codificado bajo 8 bits
a una frecuencia de 8 KHz, estas cantidades deben modificarse para lograr que el sonido
pueda viajar a través de la red (Internet), es aquí cuando los módems aplican estos
algoritmos de compresión para reducir la tasa de transferencia desde los 14 Kbps hasta
los 28.8 Kbps. Este proceso es fundamental para que la información pueda viajar en
Tiempo Real a través de la red.

El “gigante” del procesador de propósitogeneral, Intel, ha ido creando
procesadores mas adecuados para este tipo de funciones. El Pentium, y más aún el
Pentium Pro, saben reservar cada vez más recursos a los tratamientos de señales y
preservan la viabilidad de soluciones enteramente por software.

En 1995, en la aparición del tiempo real en Internet, se dieron las circunstancias
idóneas para la evolución de esta nueva tecnología (VoIP): una población de internautas
consecuente, un parque de ordenadores multimedia significativo y los recursos de
máquinas, aplicaciones y módems necesarios.

El año 1995 asiste a la multiplicación de las ofertas. Numerosas empresas
abrieron tiendas en línea, ofreciendo descargas gratuitas o pruebas de soluciones de
telefonía. Algunas han desaparecido ya. Desafortunadamente, todas las aplicaciones de
telefonía proponían soluciones propietarias que rivalizan en astucia técnica para resolver
los desafíos del tiempo real. En ausencia de especificaciones estandarizadas, los
protocolos de transporte, de control y de codificación seguían siendo, generalmente
incompatibles. El argumento comercial común a todos estos productos era la economía
de tarifas realizada al utilizar Internet, con frases como: “¡Llame al otro extremo del
mundo por el precio de una llamada local!”.

En la actualidad, podemos decir que las herramientas están a punto.

Fruto de los trabajos en MBONE, se han propuesto soluciones. Si el emisor
recibe regularmente informes de escucha de su o sus destinatarios, conocerá casi en
tiempo real el estado de la red; así como modular su flujo de salida. Conmutará su
codificador para pasar de una señal poco comprimida y de alta fidelidad a una señal más
comprimida pero menos generosa en cuanto a recursos. Un difusor de información
multimedia en tiempo real ya no emitirá a ciegas, soltando paquetes al viento en la red.

Los paquetes llevarán información que facilitará la reconstrucción de la señal y
de su base temporal; convertirán la red en un contenedor digno de un servicio en tiempo
real. La sincronización del paquete precisa la hora exacta de su creación; será fácilmente
20
reordenado, y su desaparición se reordenará con rapidez. Una etiqueta indicará el tipo
de datos enviados en el paquete y un número de secuencia lo colocará instantáneamente
en el flujo de datos. Todas estas especificaciones y otras muchas se encuentran en RTP,
el Real-time Transport Protocol, adoptado como estándar por el IETF (Internet
Engineering Task Force, Grupo de Trabajo en Ingeniería de Internet).

La estructura y las especificaciones del IP de nueva generación, el protocolo de
red básico de Internet, también se han estandarizado. El IPv6 se desplegará
progresivamente al conjunto de encaminadores en el transcurso de los próximos años.
Las cabeceras IPv6 contienen un campo de prioridad que permite tratar los datos en
tiempo real con el cuidado que merecen. El encaminador es quien tomará la iniciativa
de destruir los paquetes de baja prioridad, preservando el tránsito de la señal más
prioritaria. Y por si todo esto no basta, un tercer tipo de arma está en reserva. El
receptor podrá elegir, por sí mismo, el nivel de calidad y la comodidad de la recepción
en la señal que desee captar, programa de radio, cadena de televisión, etc. Más allá de
un cierto umbral de exigencia, podrían encontrarse pagando por los recursos que
consuma; es la base para beneficiarse de un servicio a la carta. Es el protocolo de
reserva de recursos, RSVP (Resource reSerVation Protocol), que transmite la demanda
de reserva a todos los encaminadores partiendo del receptor y remontando hasta la
fuente. [12]
1.3.3 Escenarios de VoIP
En VoIP, según se muestra en la
Figura1-7, suelen describirse cuatro escenarios típicos:

Figura 1-7: Escenarios de VoIP

1. Teléfono a PC
Este escenario, de gran interés para los ISPs (Internet Service Provider,
Proveedor de Servicios de Internet), permitiría, por ejemplo, llamar a un usuario que
está navegando por Internet.

2. PC a teléfono
PSTN VoIP
GW
IP
network
PC a teléfono Telefono a PC
Telefono a Telefono PC a PC

21
También es conocido por los nombres “click-to-dial” o “surf-and-talk”,
permitiría a un usuario llamar, por ejemplo a su ISP, y recibir respuestas a sus
preguntas, mientras continúa navegando por las páginas web.

3. Teléfono a teléfono
Escenario muy interesante para los operadores telefónicos establecidos. Puesto
que estos operadores ya poseen una gran red de conmutación de circuitos, les puede
resultar atractiva la instalación de un Gateway de telefonía IP que les permita
transportar voz sobre un backbone IP como medio de abaratar los costos de las llamadas
de larga distancia. Por ello, este escenario es también conocido por el nombre
“telephony toll bypass”.

4. PC a PC
Este escenario está particularmente para videoconferencias entre dos o más
usuarios.

1.3.4 Razones para preferir VoIP

La capacidad de hacer llamadas de voz sobre una red de datos basada en IP.
Pero, una vez dada la respuesta, se puede argumentar en su contra que, a priori, no
parece la mejor tecnología para transportar el tráfico de voz. Sin ir más lejos, tenemos
un candidato ideal en ATM.

ATM es una tecnología multimedia y multiservicio; por tanto, parecería un
candidato idóneo para el transporte de tráfico de voz y multimedia; al menos, más
indicado que IP. Recientemente han surgido especificaciones destinadas al tráfico de
voz sobre ATM (métodos como Constant Bit Rate, vía AAL1, o Variable Bit Rate, vía
AAL2). Sin embargo, ATM no está ampliamente difundido, especialmente entre las
pequeñas empresas, y es relativamente caro. Por el contrario, las redes IP están
ampliamente difundidas en el mundo empresarial, por lo que parece más interesante el
despliegue de la voz sobre la tecnología IP.

El gran impulso que está teniendo VoIP no se debe tanto a un interés tecnológico
como a un interés de mercado. En el pasado, el mercado de las telecomunicaciones
Europeo estaba cerrado por los monopolios nacionales. Sin embargo, la situación ha
cambiado en la actualidad: un mercado liberalizado está emergiendo con una gran gama
de nuevos operadores.

Los nuevos operadores no poseen una infraestructura de telecomunicaciones; por
tanto, para ellos VoIP representa un punto de entrada más fácil al mercado ya que les
facilita el despliegue de una única red que sea capaz de prestar servicios de “voz” y de
“datos”.

Las regulaciones actuales consideran VoIP como tráfico de datos, no como
tráfico de voz, lo cual permite considerar como llamada local cualquier llamada de larga
distancia cursada a través de redes IP.

El desarrollo de una red IP permitirá tener una red “all-in-one”, que posibilite
un menor costo de infraestructuras y una mejor utilización del ancho de banda de dicha
red. Los operadores de telecomunicaciones establecidos también ven las ventajas de
22
redes VoIP. No sólo representan una buena opción de reducción de costos en su
infraestructura, sino una oportunidad para ofrecer nuevos servicios que no son posibles
sobre redes de circuitos conmutados (por ejemplo, Click-to-talk en aplicaciones de e-
commerce.)
1.3.5 Retos para VoIP
Sin embargo, la tecnología VoIP debe afrontar algunos desafíos antes de poder ofrecer
un servicio de calidad a los usuarios:

• Las nuevas redes VoIP deben permitir la comunicación con las redes telefónicas
tradicionales. De no ser así, no habrá interconectividad total.
• Pero, no sólo hace falta interconectividad con las redes tradicionales de voz; ésta
debe ser transparente al usuario. Por ejemplo, debe ser posible llamar desde un
teléfono a una PC sin que el llamante tenga que conocer la dirección IP de la
PC; debería bastar con la simple marcación a un número del directorio
telefónico. El gran problema al que nos enfrentamos hoy en día es que no en
todas partes se cuenta con este servicio, en especial,en zonas rurales donde estas
llamadas no logran ser enlazadas desde una computadora a un teléfono “común”
ya que no se cuenta con equipo suficiente (media gateways) en las diversas
centrales telefónicas de las diferentes compañías telefónicas ubicadas en
distintas ciudades del país.
• El uso de una nueva tecnología, como VoIP, no debería implicar una pérdida de
la funcionalidad ofrecida por las redes tradicionales (por ejemplo, el desvío de
llamada).
• La calidad de servicio ofrecida por las redes VoIP debería ser similar a la
ofrecida por las redes telefónicas de conmutación de circuitos.
• Finalmente, se necesitan estándares que posibiliten la compatibilidad entre los
diferentes suministradores de equipos.

1.4 Protocolo IP

El protocolo de Internet (IP) es el protocolo mas representativo del modelo OSI
utilizado para la capa de Internet. La tarea principal de este protocolo es el
direccionamiento de los llamados datagramas de información, además administra el
proceso de fragmentación de dichos datagramas, entendiéndose por datagrama la unidad
de transferencia que utiliza IP. Este protocolo se caracteriza por que por si solo no
corrige errores ni controla la congestión por lo que no garantiza la entrega en secuencia
de los datagramas, esto es función del ruteo (encaminamiento) en la red.

1.4.1 Encabezado IP

Ahora bien, estos datagramas tienen cierta información adicional a la de los
datos que se quieren transportar, esta información sirve para asegurar que el datagrama
llegue a su destino y es conocida como encabezado. Entre los elementos más
importantes de este encabezado tenemos:

• Versión: Identifica la versión del protocolo, la más común es la 4, aunque
también hay IP versión 6.
• Total Lenght: La longitud total del encabezado y los datos.
23
• ToS: Tipo de Servicio, sirve para identificar a los servicios de calidad que se le
pueden dar.
• Identificación: Este ID permite hacer único al datagrama.
• TTL: Tiempo de Vida, es un contador para saber cuanto tiempo lleva el
datagrama en la red, con esto se evita que esté circulando indefinidamente.
• Checksum: Genera un código (algoritmo polinomial) para saber si el
encabezado viaja sin errores.
• Dirección de Origen y Destino: Para saber de donde viene y hacia donde va
dirigido el datagrama.

1.4.2 Direccionamiento IP

Cuando un equipo necesita enviar información a otro éste le envía la
información mediante la dirección IP, la dirección de red, la máscara y la puerta de
enlace (gateway). IP utiliza una dirección de 32 bits para identificar a un equipo y la red
a la cual pertenece. Típicamente se divide en 4 números de 8 bits, por ello se tiene
valores entre 0 y 255. Existen direcciones que por definición se conservan reservadas,
es decir, que no están en Internet y por lo tanto pueden ser utilizadas para una red
interna (lntranet), tal es el caso de la red lO.x.x.x ó 169.x.xx, es por ello que todas las
direcciones pertenecientes a esta red pueden ser utilizadas por cualquiera que no esté
conectado a Internet sin tener que pedir permiso a un organismo internacional como es
en el caso de las demás redes. Corno se verá más adelante en esta Tesis, en el proyecto
que se analiza se utilizó la red 10/8 para llevar la información concerniente a la
administración de los equipos ya que únicamente se utiliza para comunicación entre
equipos y esta información nunca “sale” a Internet.

Una dirección está compuesta por dos elementos: el número de red (identificador
de la red) y la dirección de la interfaz (host). Hay varios formatos para la dirección IP,
los cuales se diferencian por el tamaño de la red. Los formatos van de la Clase A a la
Clase E. La Clase se identifica por la secuencia de los primeros 3 bits. La Clase A son
las redes más grandes van desde la 0.0.0.1 hasta la 126.0.0.0, la Clase B tiene un rango
de direcciones que va desde la 128.0.0.0 hasta la 191.255.0.0 (la dirección 127.0.0.0
está reservada para el localhost, es decir, el propio equipo). La Clase C está
representada por las redes que van desde la 192.0.1.0 hasta la 223.255.255.0, en cuanto
a la Clase D se utiliza para funciones multicast (difusión entre más de un dispositivo)
cuyo rango es desde 224.0.0.0 hasta 239.255.235.255. Finalmente la Clase E, aunque se
usa únicamente para la investigación, va desde la red 240.0.0.0 hasta 247.255.255.255.
Estas clases corresponden al direccionamiento classful.

Fig. 1-8 Clases de direcciones IP (Classful)
24
Con la dirección IP establecida, una red tiene la capacidad de decidir si los datos
permanecerán en la misma red o serán enviados a otro destino, para lo cual se deben
enviar los paquetes a un default gateway, el cual no es más que un equipo que conoce
como llegar al equipo con el que se desea tener comunicación, este default gateway
puede ser una estación de trabajo con funciones de enrutamiento o bien propiamente un
enrutador.

Ahora bien, es importante mencionar que una red IP incluye una dirección de
difusión que se refiere a todos los elementos de la red (broadcast). De acuerdo con el
estándar IP cualquier campo de host que consista únicamente de “unos” esta reservado
para esta función, con esto se logra que un sistema envíe un solo paquete que será
difundido por toda la red, ahorrando los recursos de la misma.

También es importante destacar que se tienen limitaciones de direccionamiento
en classful debido al uso ineficaz de las direcciones IP, esto es debido a que algunas
direcciones son muy pequeñas (Clase C con sólo 256 host) y otras muy grandes como es
el caso de la Clase B con 65,536 host, lo que no deja satisfechos a las empresas que
necesitan pocas direcciones pero más de 256 ya que si optan por un direccionamiento
clase B desperdiciarían muchas direcciones. Para evitar este problema a una dirección
IP se le agrega una mascara de red la cual es una plantilla de 32 bits que hace la
correspondencia uno a uno con la dirección IP, de tal forma que si el bit está en “uno”
es indicativo de que su correspondiente bit en la dirección IP es parte del número de red,
si por el contrario el bit está en “cero”, indica que corresponde al host. Con la máscara
de red se crean las subredes, es decir, redes más pequeñas dentro de una red con
direccionamiento classful, con esto se crean las direcciones classless. Usualmente la
máscara de red se expresa por ejemplo 192.168.8.0/24 que también significa que esta
red tiene un prefijo de host de 8 bits, es decir, el número de red está compuesto por 24
bits. [8]

1.5 Factores de VoIP y Calidad de Servicio

La calidad es un aspecto fundamental, no importando de que producto o servicio
hablemos y claro esta, la telefonía IP no es la excepción. Como ya antes fue
mencionado, en VoIP la voz viaja en redes destinadas a datos y por lo tanto estas no
fueron diseñadas para transmitir en tiempo real, en consecuencia, se deben tener
medidas especiales para garantizar la calidad de las llamadas de voz.

Los factores clave que hay que tomar en cuenta para lograr una buena calidad de
voz son: retardo (debido a la codificación y decodificación, transporte dentro de la red,
etc.), perdida de paquetes, el jitter, entre otros.

1.5.1 Periodo de Empaquetamiento y Consideraciones de Ancho de Banda

El retardo en una llamada de VoIP es mucho mayor que en una llamada TDM
tradicional, esto es debido a las razones anteriormente descritas, como la aplicación de
diversos algoritmos para la compresión y descompresión de la voz. Para usar la red IP
de una forma eficaz, la voz recibida de TDM cada 125 µs no se manda inmediatamente a
la red IP, sino que es acumulada por algunos milisegundos y después sale en un paquete
IP. Teóricamente es posible reducir el retardo por empaquetamiento a unos
microsegundos pero esto desperdicia ancho de banda en la red IP y por consiguiente no
25
3.0
6.6
12.0
50.0
90.0
150.0170.0190.0
4000.0
1.00
10.00
100.001,000.00
10,000.00
PO
TS
IS
D
N
LL
A
M
A
D
A
N
A
C
IO
N
A
L
M
A
X.
L
LA
M
A
D
A
D
ET
EC
TA
B
LE
A
C
EP
TA
B
LE
SU
B
M
A
R
IN
O
S
EN
LA
C
ES
S
A
TE
LI
TA
LE
S
IN
A
C
EP
TA
B
LE
S
es eficaz, la razón es la siguiente: al momento de hacer el empaquetamiento de la voz, a
cada paquete IP se le debe agregar un encabezado lo cual hace que entre más corto sea
el periodo de empaquetamiento mayor será la cantidad de encabezados que se genera y
no sólo de RTP sino un encabezado de Ethernet, uno de IP y uno más de UDP, lo cual
genera una gran cantidad de tráfico desperdiciando ancho de banda en la red.

De ahí que la planificación de ancho de banda es un aspecto importante en el
diseño de la red. La capacidad de los enlaces debe ser comparada a los requerimientos
de ancho de banda, esto con el objetivo de identificar cuellos de botella o capacidad sin
usar o con bajo uso. El punto de partida para los cálculos de ancho de banda es la
velocidad de los datos por canal, donde debe ser considerado, no sólo los datos de voz,
sino también los diferentes encabezados.

Para el diseño de red, debe ser asumida una utilización máxima de enlace del
90%, por ejemplo un enlace Gigabit Ethernet no debería transportar más de 900 Mbps,
y un puerto Fast Ethernet no debería transportar más de 90 Mbps. Estos valores
corresponden a 7140 para canales GE y 714 para canales 100BT si no se tiene
compresión de voz.

1.5.2 Retardo (Latencia)

El retardo desde un abonado hasta el otro es el factor más importante para la
calidad vocal. La recomendación G. 114 de la UIT-T establece que un retardo de más de
90 ms puede ser notado por abonados sensibles, mientras que abonados “normales”
empezarán a notar un retardo después de los 150 ms. Cuando se mira el retardo de punta
a punta, en general, este muestra que el factor más importante para el retardo son los
Media Gateways, asumiendo una red IP que ha sido diseñada correctamente.

Retardo
En ms

Fig. 1-9 Recomendación G.114 de la UIT-T para el retardo

26
Los retardos de un sentido más allá de los 150 ms son notables para los
humanos. Por consiguiente, es de suma importancia minimizar el retardo. Los valores
de retardo dependen fuertemente de la red específica y la carga de tráfico de la red.

Como el retardo es un factor muy importante para la voz, el backbone de IP
tiene que soportar mecanismos de prioridad como el Tipo de Servicio (ToS) para
garantizar el manejo de prioridad en los datos de voz sobre IP sobre el tráfico de datos.

1.5.3 Jitter

El jitter cuantifica los efectos de retardos en la red al arribo de paquetes en el
receptor. Los paquetes transmitidos a intervalos regulares desde el origen llegan a
intervalos irregulares al destino. Un jitter excesivo hace a la voz entrecortada y difícil de
entender. En otras palabras, el jitter es el retardo del retardo. El jitter es calculado en
base al tiempo entre las llegadas de paquetes sucesivos.

Para contrarrestar los efectos del jitter se crean los buffers del jitter, los cuales
consisten en buffers de paquetes que retienen paquetes entrantes por una cantidad
específica de tiempo y son usados para neutralizar los efectos de las fluctuaciones de la
red y crear un flujo de paquetes sin problemas en el punto de recepción.

Paquetes a intervalos Paquetes a intervalos
Iguales Diferentes

Fig. 1-10 Representación grafica del Jitter

El retardo y el jitter traen como consecuencia la generación de eco en la señal de
voz, es decir, después de cierto tiempo la señal de voz vuelve a ser escuchada por el
receptor provocando una molestia ya que en ocasiones el eco puede tener una potencia
considerablemente alta originando que no se pueda entender el mensaje original. [4]

1.5.4 Pérdida de paquetes

La pérdida de paquetes ocurre típicamente en ráfagas o periódicamente debido a
una red continuamente congestionada. Pérdidas periódicas del 5 al 10% de todos los
paquetes vocales transmitidos pueden degradar la calidad vocal significativamente.
Ráfagas ocasionales de pérdida de paquetes también pueden hacer a la conversación
difícil de entender, de ahí que se recomienda que una red de datos deba tener una
pérdida de paquetes menor al 1%.

En el caso de las redes de VoIP no es conveniente la retransmisión de paquetes
en caso de pérdida de alguno de ellos como es el caso de TCP, esto es debido a los
1 2 3 Red IP 1 2 3
27
problemas que trae consigo la retransmisión, como por ejemplo, un mayor retardo en la
recepción de la señal, mayor procesamiento en la señal y la necesidad de un mayor
buffer para almacenar más tiempo la señal de voz.

Estos son los problemas más comunes en las redes de VoIP, pero para cada uno
de ellos existe una solución como se verá a continuación.

La pérdida de paquetes puede ser un problema aún mayor dependiendo del tipo
de red de paquetes que esté siendo usada. En redes IP actuales, todos los marcos de voz
son tratados como datos. Bajo congestión, las ramas de voz serán descartadas al igual
que las de datos, estas últimas sin embargo no son sensibles al tiempo, y los paquetes
descartados pueden ser recuperados con la retransmisión, mientras que los paquetes de
voz no pueden ser tratados de esta manera.

Algunas de las formas para corregir la pérdida de paquetes de voz son interpolar
los paquetes de voz perdidos al repetir el último paquete recibido durante el intervalo
cuando el paquete perdido supuestamente debía ser analizado, este esquema es un
método simple que llena el tiempo entre tramas de voz no continuas, este mecanismo
trabaja bien cuando la incidencia de tramas perdidas es poco frecuente; si el número de
paquetes perdidos en una fila o ráfaga es alta no trabaja muy bien.

Otra forma de corregir la pérdida de paquetes es enviar información redundante
a expensas de la utilización del ancho de banda; esta aproximación hace una réplica y
envía el n-ésimo paquete de voz con el paquete n+1; este método tiene la ventaja de
poder corregir la pérdida del paquete exacto, sin embargo, usa más ancho de banda e
incrementa el retardo. Finalmente para corregir este problema se puede usar una
aproximación híbrida con ancho de banda menor del codificador de voz para
proporcionar información redundante que será llevada en el paquete n+1; esto reduce el
problema de necesidad de ancho de banda extra pero falla en la resolución del problema
de retardo. [4]

1.5.5 Codecs, MOS y PESQ

Recordemos que la voz tiene un gran ancho de banda, es decir, la cantidad de
información necesaria para transmitir de manera exitosa voz es mucho mayor que la
necesaria para transmitir únicamente datos, esto puede saturar a la red de datos, por ello
se han creado algunos algoritmos para comprimir la voz, dichos algoritmos son
llamados codificadores de voz o codecs, de tal forma que se disminuye el ancho de
banda considerablemente, aunque esto impacta directamente en el retardo, esto debido a
que conlleva un procesamiento de la señal el cual consume tiempo. De ahí que se hayan
generado una gran cantidad de codecs dependiendo de las necesidades de la red, por ello
existen las siguientes recomendaciones de la UIT-T:

• G. 711: Esta recomendación especifica la modulación PCM para la codificación
de señales vocales aplicable a sistemas de transmisión digitales y equipo
Terminal. En este caso, no hay compresión vocal y la velocidad de transmisión
es de 64 kbit/s. La G.711 es también aplicable para módem, tonos DTMF y
señales de fax.
• G.723: Esta recomendación detalla una representación codificada usada para
comprimir voz u otras señales de audio componentes de un servicio multimedia
28
a una baja velocidad de bits. Este codificador tiene dos velocidades asociadas:
6.3 kbps, la cual usa la técnica “Cuantificación de Probabilidad Máxima Multi-
pulso (MP-MLQ) y la de 5.3 kbit/s, la cual usa la técnica“Predicción Lineal
Excitada de Código Algebraico” (ACELP).
• G.729A: Esta recomendación describe el algoritmo para la codificación de
señales vocales a 8 kbps basado en la técnica “Predicción Lineal Excitada de
Código Algebraico de Estructura Conjugada (CS-ACELP). La letra A al final es
el Anexo que ocupa, también existe el Anexo B.
• G. 726: Esta recomendación describe la modulación PCM Diferencial Adaptable
(ADPCM), un algoritmo para la codificación de voz a 16, 24, 32 ó 40 kbps. Este
algoritmo codifica la diferencia entre amplitud de muestra de audio actual y la
amplitud se predice y se adapta a la resolución basándose en valores
diferenciales recientes.

En la siguiente tabla se muestran las características de cada uno de los codecs
anteriormente mencionados:

Codec Algoritmo Tasa de
Transmisión
Kbps
Retardo
end-to-
end en ms
Calidad
Vocal
Comentarios
G.711 PCM 64 <<1 Excelente Sin compresión,
uso universal
G.723 ACELP 5.3, 6.3 67 - 97 Bueno Tiene su origen
para
videoconferencias
G.729 A ACELP 8 25 - 35 Bueno El mas usado
por su poco
retardo y buena
compresión
G.726 ADPCM 16, 24, 32,
40
60 Bueno Buena calidad y
Baja complejidad
Tabla 1-1 – Comparación entre diferentes Codecs

Muy ligado a los codecs tenemos un concepto interesante que es la calidad de la
voz, la cual es complicada para obtener un valor o determinarla debido a la gran
cantidad de variables que se tienen, ya que, por ejemplo, es diferente la voz de una
mujer a la de un hombre, además de que no todos escuchamos las mismas frecuencias
de la misma forma y muchos otros factores que influyen en lo que escuchamos, por ello
para medir la calidad de voz la UIT en su recomendación P.800 propone una prueba de
calidad de voz subjetiva basada en Resultados de Opinión Media (M0S). Dicha
recomendación está basada en muestras vocales preseleccionadas grabadas de acuerdo a
la recomendación P.50 que son reproducidas a un grupo mixto de hombres y mujeres
bajo condiciones controladas. Los resultados dados por el grupo son ponderados para
dar una puntuación MOS que va desde 1 (a la peor) a 5 (a la mejor), como se muestra en
la Tabla 1-2.

El problema con la medición del MOS es que, como su nombre lo indica, es
subjetiva, es de opinión, por lo tanto se necesitaba de una forma más objetiva de
medirla, aunque esta no represente totalmente la calidad de la voz. Así surge el PESQ
29
(Perceptual Evaluation os Speech Quality) como un importante estándar para medir la
calidad de la voz, dicho estándar se encuentra en la recomendación P.862 de la UIT.

PESQ predice el resultado de la calidad similar a los que se obtienen con el
MOS, de hecho se calibra contra resultados obtenidos mediante MOS. Con esta
evaluación se puede tener buena precisión en pruebas de niveles de entrada en un codec,
errores en el canal de transmisión, perdida de paquetes, ruido ambiental, entre otras.
Además de que trabaja bien para codecs como G.711, G.729 y G.723. Por ello es’ muy
utilizado en pruebas de desempeño de codecs, selección de equipo de VoIP y monitoreo
de la red.

Básicamente lo que se hace en este tipo de pruebas es insertar una señal de voz
conocida al sistema bajo prueba y comparar la señal de salida con la de entrada (señal
de referencia). Lo que se compara entre una señal y otra es:

• El nivel de alineación de potencia: Para comparar las señales, la señal de
referencia y la señal degradada deberían tener el mismo nivel de potencia.
• Alineación de tiempo: Se analiza que tanta diferencia en tiempo existe entre la
señal de entrada y la de salida, con esto se puede obtener el retardo.
• Transformación auditiva: Se obtiene una representación de tiempo y de
frecuencia de la señal percibida lo que se conoce como sensación superficial.
• Proceso de molestias: La diferencia entre la sensación superficial y la señal
degradada es conocido como error superficial, él cual muestra las diferencias
audibles introducidas por el sistema bajo prueba.

Este análisis proporciona los errores en el sistema, los cuales son convertidos en
puntuaciones de calidad de voz. Esta puntuación esta basada en la escala de la calidad
de escucha, la cual es la anteriormente mencionada MOS cuya escala es:

MOS Resultado de
Opinión
Esfuerzo para
Escuchar
Volumen
5 Excelente No se requiere
esfuerzo para
escuchar.
Mucho más alto de
lo preferido.
4 Bueno Es necesario un
poco de Atención,
pero no se requiere
esfuerzo.
Más fuerte de lo
Preferido.
3 Justo Se requiere un
esfuerzo moderado
Preferido
2 Pobre Se requiere un
esfuerzo
considerable
Más bajo de lo
preferido.
1 Malo No se entiende el
mensaje
Mucho mas bajo de
lo preferido.
Tabla 1-2 – Resultados de Opinión Media (MOS) para la voz.

30
Como se analizó anteriormente, existe diversos codecs, cada uno con diferentes
algoritmos de compresión de voz y diferentes tasas de transmisión, es por ello que como
es de esperarse, los niveles de MOS aceptables para cada uno de ellos sea diferente. A
continuación se muestran los valores de MOS aceptables para los codec anteriormente
vistos:

3.9
3.6 3.4
0
0.5
1
1.5
2
2.5
3
3.5
4
MOS
G.711 G.729 G.726
Codec
MOS VS Codec

Fig. 1-11 – MOS VS Codec

Así mismo, este valor de MOS aceptable varía dependiendo de la cantidad de
veces que los paquetes de voz sean codificados, ya que entre más veces se procese la
señal, menor será la calidad de la voz. Es de esperarse que no siempre se procese la voz
una sola vez, de hecho. lo más común es hacerlo dos veces, la primera para convertirlo
de señal de voz digital a paquetes de voz y la segunda para hacer el proceso inverso,
esto debido a que el destino pudiera ser otro teléfono de la red PSTN. En la Figura 1-12
se muestra el valor de MOS aceptable para los codecs anteriormente vistos cuando se
tienen varias codificaciones. Note que, por ejemplo, G.729 x 2 significa que la señal de
voz fue codificada con G.729 y después decodificada antes de alcanzar al usuario final.

0
0.5
1
1.5
2
2.5
3
3.5
4
MOS
G.729 G.729 x G.726 G.729 x 2 G.729 x 3

Fig. 1-12 – MOS de varios procesos de codificación y descodificación.

31
1.5.6 Supresión de Silencio, Ruido Confortable y VAD

Una conversación típica tiene entre un 35 % y un 50 % de silencio, por eso para
disminuir la carga en la red se ha creado un dispositivo capaz de detectar los periodos de
silencio para así eliminarlos, con lo cual se ahorra un gran porcentaje del ancho de
banda utilizado. Este dispositivo es el conocido como Detector de Actividad de Voz o
VAD por sus siglas en inglés. El mecanismo de supresión de silencio puede ser
realizado a nivel del codec de audio, por ejemplo, el Anexo A de la recomendación
G.723.l de la UIT-T introduce una estrategia de supresión de silencio para el codec
G.723.l. Sin embargo, no existen mecanismos similares en otros codecs tales como
G.711.

El problema surge cuando realmente no se envía ningún dato en la llamada,
cuando se suprime el silencio de forma total. Esto debido, en primer lugar, a que el
receptor (humano) tiene la sensación de que la llamada se ha cortado o que perdió la
comunicación con el otro extremo. Además, si ningún dato es enviado en la
conversación se puede escuchar un “clic” resultante del cambio de los niveles de señal
entre el sonido previamente enviado (conversación) y el silencio insertado cuando el
sistema no tiene nada más que enviar.

Para evitar los vacíos de información, los momentos en los que no hay
conversación tienen que ser llenados con un ruido confortable, el cual contiene un
mensaje compuesto por un único octeto de bits que le indican al receptor que debe
reproducir un ruido a un nivel especificado. Este mensaje deberá ser enviado el
principio de un periodo de silencio, el cual obviamente indica la transición de una
conversación a silencio.
La supresión de silencio y los mecanismos de generación de ruido confortable