Logo Studenta

Analisis-experimental-del-umbral-de-percepcion-entonativa-en-el-Espanol-del-Centro-de-Mexico

¡Este material tiene más páginas!

Vista previa del material en texto

UNIVERSIDAD NACIONAL AUTÓNOMA 
DE MÉXICO 
 
 
FACULTAD DE FILOSOFÍA Y LETRAS 
COLEGIO DE LETRAS HISPÁNICAS 
 
 
 
 
ANÁLISIS EXPERIMENTAL DEL UMBRAL DE 
PERCEPCIÓN ENTONATIVA EN EL ESPAÑOL DEL 
CENTRO DE MÉXICO 
 
 
TESIS 
QUE PARA OBTENER EL TÍTULO DE: 
 
LICENCIADA EN LENGUA Y LITERATURAS 
HISPÁNICAS 
 
P RESENTA: 
LAURA MURRIETA BELLO 
 
ASESOR: 
DR. PEDRO MARTÍN BUTRAGUEÑO 
 
 
 
CIUDAD DE MÉXICO, 2016 
 
 
UNAM – Dirección General de Bibliotecas 
Tesis Digitales 
Restricciones de uso 
 
DERECHOS RESERVADOS © 
PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL 
 
Todo el material contenido en esta tesis esta protegido por la Ley Federal 
del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). 
El uso de imágenes, fragmentos de videos, y demás material que sea 
objeto de protección de los derechos de autor, será exclusivamente para 
fines educativos e informativos y deberá citar la fuente donde la obtuvo 
mencionando el autor o autores. Cualquier uso distinto como el lucro, 
reproducción, edición o modificación, será perseguido y sancionado por el 
respectivo titular de los Derechos de Autor. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
A mi madre y hermano, como todo. 
 
 
 
 
 
 
AGRADECIMIENTOS 
 
Agradezco a la Universidad Nacional Autónoma de México donde me he formado 
académicamente. También al Consejo de Ciencia y Tecnología (Conacyt) y a El Colegio de 
México por el financiamiento para el desarrollo de este proyecto de tesis. 
 A mis informantes, quienes me regalaron su tiempo para realizar los experimentos. 
Fue una tarea a la que no estaban acostumbrados y la desempeñaron con completa 
colaboración y amabilidad. 
 A mis lectores, gracias por sus comentarios y correcciones que me ayudaron a que 
esta tesis mejorara y a que yo aprendiera. 
 A mi asesor, el Dr. Pedro Martín Butragueño, a quien admiro y aprecio. Gracias por 
ayudarme a crecer como lingüista y como persona. Su guía ha sido una de las experiencias 
más enriquecedoras de mi vida. 
 A los integrantes del Seminario de Prosodia, especialmente a Jonathan Caballero, 
que me ayudaron en el desarrollo de este proyecto. 
 A mi familia por su apoyo, formación y cariño pero, sobre todo, por su paciencia. 
También agradezco a mis amigos por las experiencias que hemos compartido. 
 
 
 
 
 
1 
 
ÍNDICE GENERAL 
 
INTRODUCCIÓN…………………………………………………………………………… 
 
7 
CAPÍTULO 1: MARCO TEÓRICO…………………………………………………………… 
 
11 
CAPÍTULO 2: METODOLOGÍA……………………………………………………………... 23 
2.1. Pruebas preliminares…………………………………………………………. 23 
2.1.1. Primera prueba piloto………………………………………………… 24 
2.1.2. Segunda prueba piloto………………………………………………... 28 
2.1.3. Tercera prueba piloto…………………………………………………. 31 
2.2. Experimentos definitivos……………………………………………………… 36 
2.2.1. Fase de contextos lingüísticos………………………………………... 36 
2.2.2. Fase de estímulos bisilábicos………………………………………… 39 
2.3. Diseño y edición de los estímulos…………………………………………….. 40 
2.4. Aplicación de los experimentos………………………………………………. 43 
2.4.1. Muestreo……………………………………………………………… 
 
44 
CAPÍTULO 3: ANÁLISIS DE RESULTADOS………………………………………………….. 47 
3.1. Método de análisis……………………………………………………………. 47 
3.2. Análisis de resultados………………………………………………………… 51 
3.2.1. Resultados según el contexto lingüístico……………………………... 51 
3.2.2. Resultados del experimento ba.ba……………………………………. 82 
3.2.3. Resultados según la oposición nivel/contorno……………………….. 90 
3.3. Conclusiones parciales……………………………………………………….. 
 
92 
CAPÍTULO 4: DISCUSIÓN Y CONCLUSIONES……………………………………………….. 
 
95 
REFERENCIAS BIBLIOGRÁFICAS………………………………………………………....... 
 
103 
ANEXOS 
Anexo 1. Script del experimento de contextos lingüísticos………………………... 107 
Anexo 2. Script del experimento de estímulos bisilábicos………………………… 109 
Anexo 3. Resultados de los experimentos de contorno con los casos de igualdad... 111 
Anexo 4. Resultados de los experimentos de contorno sin los casos de igualdad.... 115 
 
2 
 
 
3 
 
ÍNDICE DE TABLAS 
 
Tabla 2.1. Distribución de los estímulos de la prueba de nivel. Primera prueba piloto………… 27 
Tabla 2.2. Distribución de los estímulos de la prueba de contorno. Primera prueba piloto…….. 27 
Tabla 2.3. Distribución de los estímulos de la prueba de nivel. Segunda prueba piloto……… 30 
Tabla 2.4. Distribución de los estímulos de la prueba de contorno. Segunda prueba piloto….. 30 
Tabla 2.5. Distribución de los estímulos para las pruebas de contextos lingüísticos…………. 32 
Tabla 2.6. Distribución de los estímulos para el experimento bisilábico……………………... 35 
Tabla 3.1. Casos en que se reconocieron los estímulos como diferentes en el contexto 
fonemático…………………………………………………………………………. 
 
52 
Tabla 3.2. Frecuencias acumuladas. Contexto fonemático. Informante 1…………………….. 54 
Tabla 3.3. Cuartiles con sus respectivas medianas y medias. Contexto fonemático. 
Informante 1……………………………………………………………………….. 
 
54 
Tabla 3.4. Casos en que se reconocieron los estímulos como diferentes. Contexto 
fonemático. Informante 1………………………………………………………….. 
 
57 
Tabla 3.5. Frecuencias acumuladas. Contexto fonemático. Informante 1……………………. 58 
Tabla 3.6. Cuartiles con sus respectivas medianas y medias. Contexto fonemático. 
Informante 1……………………………………………………………………….. 
 
58 
Tabla 3.7. Resultados generales para el contexto fonemático………………………………… 60 
Tabla 3.8. Resultados generales para el contexto fonemático donde no se contabilizaron los 
casos de igualdad…………………………………………………………………... 
 
62 
Tabla 3.9. Casos en que se reconocieron los estímulos como diferentes. Contexto silábico. 
Informante 1……………………………………………………………………….. 
 
64 
Tabla 3.10. Frecuencias acumuladas. Contexto silábico. Informante 1………………………... 65 
Tabla 3.11. Cuartiles con sus respectivas medianas y medias. Contexto silábico. Informante 1. 66 
Tabla 3.12. Casos en que se reconocieron los estímulos como diferentes. Contexto silábico. 
Informante 1……………………………………………………………………….. 
 
67 
Tabla 3.13. Frecuencias acumuladas. Contexto silábico. Informante 1………………………... 68 
Tabla 3.14. Cuartiles con sus respectivas medianas y medias. Contexto silábico. Informante 1. 69 
Tabla 3.15. Resultados generales para el contexto silábico……………………………………. 71 
Tabla 3.16. Resultados generales para el contexto silábico donde no se contabilizaron los 
casos de igualdad…………………………………………………………………... 
 
72 
Tabla 3.17. Casos en que se reconocieron los estímulos como diferentes. Contexto frástico. 
Informante 1……………………………………………………………………….. 
 
73 
4 
 
Tabla 3.18. Frecuencias acumuladas. Contexto frástico. Informante 1………………………… 75 
Tabla 3.19. Cuartiles con sus respectivas medianas y medias. Contexto frástico. Informante 1. 75 
Tabla 3.20. Casos en que se reconocieron los estímulos como diferentes. Contexto frástico. 
Informante 1……………………………………………………………………….. 
 
76 
Tabla 3.21. Frecuencias acumuladas. Contexto frástico. Informante 1………………………… 78 
Tabla 3.22. Cuartiles con sus respectivas medianas y medias…………………………………. 78 
Tabla 3.23. Resultados generales para el contexto frástico…………………………………….. 80 
Tabla 3.24. Resultados generales para el contexto frástico donde no se contabilizaron los 
casos de igualdad…………………………………………………………………... 
 
81 
Tabla 3.25. Casos en que se reconocieron los estímulos como diferentes. Informante 1……… 83 
Tabla 3.26. Frecuencias acumuladas. Informante 1……………………………………………. 84 
Tabla 3.27. Cuartiles con sus respectivas medianas y medias. Informante 1…………………... 84 
Tabla 3.28. Casos en que se reconocieron los estímulos como diferentes. Informante 1……… 85 
Tabla 3.29. Frecuencias acumuladas. Informante 1. Los datos excluyen los casos de igualdad. 86 
Tabla 3.30. Cuartiles con sus respectivas medianas y medias. Informante 1. Los datos 
excluyen los casos de igualdad……………………………………………………. 
 
87 
Tabla 3.31. Resultados generals del experimento ba.ba……………………………………….. 88 
Tabla 3.32. Resultados generalesdel experimento ba.ba donde no se contabilizaronlos casos 
de igualdad………………………………………………………………………… 
 
89 
Tabla 3.33. Puntos de inflexión en el experimento de contorno……………………………….. 91 
Tabla 4.1. Tabla de resumen con los umbrales para cada contexto lingüístico y para el 
experimento de estímulos bisilábicos……………………………………………… 
 
95 
 
 
5 
 
ÍNDICE DE FIGURAS 
 
Figura 1.1. Función linealy función logarítmica……………………………………………….. 15 
Figura 1.2. Curvas melódicas en Hz y st………………………………………………………. 16 
Figura 2.1. Toma de pantalla donde se muestra la aplicación del experimento de contexto 
lingüísticos………………………………………………………………………… 
 
38 
Figura 2.2. Toma de pantalla donde se muestra la aplicación del experimento bisilábico……. 40 
Figura 2.3. Toma de pantalla donde la curva melódica en el proceso de regularización……… 41 
Figura 2.4. Toma de pantalla donde la curva melódica de un estímulo de contorno después de 
ser editada…………………………………………………………………………. 
 
42 
Figura 3.1. Representación gráfica de la ecuación lineal y la R de Pearson para los datos del 
informante 1 del contexto fonemático…………………………………………….. 
 
53 
Figura 3.2. Dispersión de las frecuencias acumuladas con sus respectivas R de Pearson y 
ecuaciones lineales. Contexto fonemático. Informante 1…………………………. 
 
55 
Figura 3.3. Representación gráfica con su respectiva R de Pearson para los datos del 
informante 1 del contexto fonemático……………………………………………... 
 
57 
Figura 3.4. Dispersión de las frecuencias acumuladas con sus respectivas R de Pearson. 
Contexto fonemático. Informante 1………………………………………………... 
 
59 
Figura 3.5. Representación gráfica de la R de Pearson y su regresión lineal para los datos del 
informante 1 del contexto silábico………………………………………………… 
 
65 
Figura 3.6. Representación gráfica de las frecuencias acumuladas. Contexto silábico. 
Informante 1. Donde la curva oscura pertenece a los datos del total de los casos y 
la curva clara pertenece a los datos de los casos marcados como diferentes……… 
 
 
66 
Figura 3.7. Representación gráfica de la R de Pearson para los datos del informante 1 del 
contexto silábico…………………………………………………………………… 
 
68 
Figura 3.8. Representación gráfica de la curva sigmoidal de las frecuencias acumuladas. 
Contexto silábico. Informante 1…………………………………………………… 
 
69 
Figura 3.9. Representación gráfica de la R de Pearson para los datos del informante 1 del 
contexto frástico…………………………………………………………………… 
 
74 
Figura 3.10. Representación gráfica de la curva sigmoidal de las frecuencias acumuladas. 
Contexto frástico. Informante 1……………………………………………………. 
 
75 
Figura 3.11. Representación gráfica de la R de Pearson para los datos del informante 1 del 
contexto frástico…………………………………………………………………… 
 
 
77 
6 
 
Figura 3.12. Representación gráfica de la curva sigmoidal de las frecuencias acumuladas. 
Contexto frástico. Informante 1……………………………………………………. 
 
79 
Figura 3.13. Representación gráfica de la R de Pearson para los datos del informante 1………. 83 
Figura 3.14. Representación gráfica de la curva sigmoidal de las frecuencias acumuladas. 
Informante 1……………………………………………………………………….. 
 
85 
Figura 3.15. Representación gráfica de la R de Pearson para los datos del informante 1. Los 
datos excluyen los casos de igualdad……………………………………………… 
 
86 
Figura 3.16. Representación gráfica de la curva sigmoidal de las frecuencias acumuladas. 
Informante 1. Donde la curva oscura pertenece a los datos del total de los casos y 
la curva clara pertenece a los datos de los casos marcados como diferentes. Los 
datos excluyen los casos de igualdad.……………………………………………... 
 
 
 
87 
 
 
7 
 
INTRODUCCIÓN 
 
La percepción consiste en la interpretación que nuestro cerebro hace de los estímulos que 
recibe. Esta interpretación está sujeta tanto a influencias internas como externas, por lo que 
fue difícil encontrar una aproximación adecuada en los primeros estudios sobre este 
fenómeno. En el caso concreto de la percepción de elementos lingüísticos, intervienen tanto 
la capacidad auditiva de cada individuo, como los diferentes sistemas lingüísticos que 
afectan su interpretación. Durante muchos años parecía imposible que esta área pudiera 
estudiarse con rigor científico. No obstante, a principios del siglo XIX y gracias a los 
estudios de Ernst Heinrich Weber y Gustav Theodor Fechner surgió la psicofísica (Johnson, 
Hsiao & Yoshioka, 2002); el objeto de estudio de esta ciencia es la relación entre los 
estímulos sensoriales y su percepción. Ahora sabemos que existe una relación directamente 
proporcional entre ambas dimensiones, relación de la cual se hablará en el capítulo 1 de 
esta tesis. Con base en el trabajo de Weber y Fechner, se ha estudiado de forma objetiva la 
percepción y, aunque se siguen debatiendo varias cuestiones relacionadas con el tema, es 
posible analizar de forma concreta cómo percibimos los estímulos lingüísticos, entre 
muchas otras cuestiones. 
 En el análisis de las curvas melódicas se toma como medida fija 1.5 semitonos para 
decir que una diferencia en la F0 es significativa. Esto se estableció bajo el supuesto de que 
1.5 semitonos es la cantidad mínima perceptible por los hablantes. No obstante, se sabe que 
la percepción de los estímulos sonoros puede verse afectada por cuestiones ajenas a la 
capacidad auditiva de cada individuo. Se supone que un músico, por ejemplo, es capaz de 
percibir diferencias tonales de un cuarto de tono. Bajo esta premisa, es posible que las 
diferencias en los sistemas lingüísticos también influyan en la percepción. Incluso el 
contexto lingüístico puede afectar la forma en que interpretamos las diferencias tonales de 
la F0. Por ello es importante que se hagan trabajos experimentales para saber los posibles 
comportamientos perceptuales según las diferentes lenguas. 
 Después de ver este tema en el curso de Fonética forense de Letras Hispánicas y 
discutirlo con mi asesor, surgió la idea de realizar un experimento para comprobar si 1.5 
semitonos son suficientes para percibir las diferencias tonales de la F0. Asimismo, tuvimos 
la duda de si la percepción se vería influida por el contexto lingüístico, por lo que 
8 
 
decidimos agregar experimentos con el fin de observar las diferencias perceptuales entre los 
contextos fonemáticos, silábicos y frásticos. Para poder analizar esto, es necesario un 
enfoque experimental, ya que es imposible observar la percepción de forma certera si uno 
se restringe a un estudio descriptivo. 
 El método empírico, que se basa en la experimentación, permite aislar el fenómeno 
y revelar cuestiones que difícilmente podrían apreciarse de otra forma. En prosodia, por 
ejemplo, se puede aislar la F0 de la intensidad y duración y estudiarla sin otros factores que 
influyan en su percepción. De ese modo, lo que se observe a través de un experimento se 
puede atribuir a la F0 y no queda la incertidumbre de que la intensidad y la duración 
influyan en lo observado. Asimismo, este tipo de análisis da pie a que surjan fenómenos 
que no se habían observado con anterioridad. 
 
En el capítulo 1 de esta tesis se presenta un marco teórico con dos líneas principales. Por un 
lado, se muestra lo que se ha hecho dentro del área de la percepción en prosodia, así como 
algunas discusiones relacionadas con el tema. Y, por otro lado, se presenta un breve 
panorama de cómo la psicofísica y la música han estudiado la percepción de estímulos 
auditivos. 
 En el capítulo 2, que corresponde al apartado de metodología, se explica en detalle 
todo el proceso del diseño experimental y de su aplicación. Se menciona también el proceso 
de piloteo que se hizo para llegar a los experimentos finales, ya que varios aspectos se 
corrigieron gracias a las pruebas preliminares. 
 El capítulo 3 inicia con una breve explicación del método de análisis, de modo que 
se definen algunos conceptos básicos de estadística que se usaron en el trabajo y se justifica 
el tamaño de la muestra. Después,se presentan los resultados de los experimentos y su 
análisis. Finalmente, la discusión de los resultados se encuentra en el capítulo 4. 
 
9 
 
OBJETIVOS 
El principal objetivo de esta tesis es analizar de qué manera se comporta el posible umbral 
de percepción de las diferencias en la frecuencia fundamental (F0). Esto no se limita a 
establecer un valor para dicho umbral, sino que también se presenta un análisis 
experimental que contempla tres contextos lingüísticos −fonemático, silábico y frástico− 
para estudiar las posibles diferencias perceptuales entre estos contextos. Asimismo, interesa 
un contraste con los trabajos previos, por lo que se usará el experimento de Pamies et al. 
(2001) como base para uno de los experimentos de la tesis. 
 
HIPÓTESIS 
Trabajos previos, que se abordarán dentro del marco teórico, proponen que el umbral de 
percepción de las diferencias tonales se ubica alrededor de 1.5 semitonos. La principal 
hipótesis es que, en términos generales, el umbral estará cerca de dicho valor, pero que 
habrá diferencias entre los diferentes contextos de información lingüística en que se ven 
involucrados los estímulos lingüísticos. 
 
JUSTIFICACIÓN 
En los estudios prosódicos, la frecuencia fundamental, o F0, es el elemento más analizado, 
ya que transmite la mayoría de la información prosódica. Gracias a los avances 
tecnológicos y a su fácil acceso, este campo de investigación se ha desarrollado 
exponencialmente en los últimos años. No obstante, la forma en que deben medirse las 
variaciones de la curva melódica es un tema de discusión recurrente. Uno de los problemas 
es que, aunque la curva es un continuo, está formada por elevaciones y descensos tonales 
de diferentes magnitudes, que hay que medir. Una de las propuestas es que se use una 
magnitud relativa para medir los movimientos tonales anteriores, aunque el método que se 
ha usado en los estudios recientes es el de establecer un valor fijo para identificar las 
diferencias significativas. 
Para lograr una uniformidad metodológica, se estableció 1.5 semitonos para decir 
que un cambio en la F0 es significativo. No obstante, es necesario que estudios perceptuales 
verifiquen que efectivamente 1.5 semitonos es lo que se percibe. Y aunque se ha hecho este 
tipo de trabajos en otras lenguas y otras variedades del español, los cuales se expondrán en 
10 
 
el capítulo 1, no hay uno para el español del centro de México, por lo que es pertinente 
realizarlo y contrastar los resultados con los de trabajos previos. 
Asimismo, hay varios elementos que influyen en la percepción de la frecuencia 
fundamental. Entro ellos se encuentra el contexto lingüístico. Es posible que la percepción 
de la F0 de una sílaba sea diferente a la de una frase o un fonema. En esta tesis se tomó en 
cuenta dicha posibilidad y los experimentos fueron diseñados con el fin de analizar la 
influencia de tres contextos: fonemático, silábico y frástico. 
 
 
11 
 
CAPÍTULO 1 
MARCO TEÓRICO 
 
Ya que la percepción es un fenómeno que se ha estudiado desde diferentes disciplinas, en 
este capítutulo se expondrá lo que se ha hecho en lingüística, psicología y música en 
materia de percepción auditiva. También se abordarán algunos conceptos relacionados con 
la percepción de estímulos lingüísticos como la diferencia entre las escalas lineales, 
logarítmicas y psicoacústicas y sus implicaciones en los estudios prosódicos. 
 
Gracias a los avances tecnológicos y a su relación con diferentes áreas de la lingüística, el 
estudio de la entonación se ha desarrollado exponencialmente. Uno de los campos de 
estudio más productivos en los últimos años es la relación entre prosodia, sintaxis y 
discurso (Martín Butragueño, 2006). Es cada vez más frecuente que los trabajos sintácticos 
incluyan en su estudio una base prosódica en la que se observa el comportamiento de los 
fenómenos suprasegmentales en diferentes contextos lingüísticos. Gracias a los estudios 
prosódicos sabemos, por ejemplo, que los movimientos de la curva melódica son un 
elemento fundamental para distinguir entre una oración aseverativa como Ya está lista la 
cena y su par mínimo interrogativo ¿Ya está lista la cena? (Martín Butragueño, 2014). De 
igual forma, en sociolingüística, los estudios prosódicos tienen un fuerte impacto y han 
ayudado a que esta área crezca con rapidez. Gracias a ellos sabemos, entre otras cosas, que 
en la Ciudad de México hay un proceso de integración dialectal, el cual se ve reflejado en la 
disminución de las prominencias tonales de las sílabas nucleares (Martín Butragueño, en 
preparación). 
Al mismo tiempo que los estudios prosódicos han aumentado, se siguen trabajando 
varios temas relacionados con el área. Martínez Celdrán y Fernández Planas (2007) 
distinguen tres niveles dentro del estudio prosódico. El primer nivel es el físico, que 
corresponde a parámetros prosódicos como el tono, la duración y la intensidad. El segundo 
nivel es la interpretación fonética de los valores físicos y es conocido como la melodía. Por 
último, el tercer nivel es la interpretación fonológica de la melodía: la entonación. 
 El tono es un fenómeno suprasegmental que se manifiesta mediante la variación de 
la frecuencia fundamental dentro de una sílaba (Llisterri, 2015) y la curva melódica es la 
12 
 
representación acústica, expresada mediante la F0, de la entonación (Cantero, 1999). Es por 
ello que para estudiar la entonación es necesario analizar correctamente la curva melódica. 
Y, aunque ésta es un continuo, está formada por variaciones de la F0. Estas variaciones 
deben medirse, pero para esto hay que establecer un parámetro de dicha medición. Es ahí 
donde surge la discusión sobre qué método es mejor para medir las diferencias tonales y 
cómo funciona la percepción de dichas diferencias. 
 Existen dos propuestas principales para medir las diferencias tonales de la F0 
(Cantero, 1999). La primera consiste en una relativización de cada valor tonal con respecto 
al valor anterior, mientras que la segunda pretende establecer un valor fijo, el cual debería 
coincidir con el umbral de percepción de las diferencias tonales. 
Ambas propuestas presentan dificultades. La primera parece sencilla en tanto que no 
haría falta preguntarse si las diferencias que se consideran significativas serían o no 
percibidas por un hablante, aunque por esto mismo sería un análisis cuestionable. Además, 
esa relativización de los valores dentro de la curva melódica podría generar diferencias 
entre los análisis, ya que dificultaría la comparación entre resultados de diferentes trabajos 
–pues cada uno usaría un valor diferente para medir las F0 de sus datos– y complicaría las 
réplicas en el aspecto metodológico. Por otro lado, la segunda propuesta obliga a una serie 
de estudios experimentales para establecer dicho umbral de percepción. Y, bajo el supuesto 
de que la percepción tonal no es la misma para los hablantes de lenguas tonales y no tonales 
–y que incluso podría variar entre cada lengua–, es necesario hacer estudios perceptuales 
sobre la entonación en hablantes de diferentes lenguas. 
 En muchos estudios prosódicos, actualmente se usa un valor de referencia para 
medir las variaciones en la curva melódica. Normalmente se usa 1.5 semitonos para 
establecer que las diferencias tonales estudiadas son significativas. No obstante, este valor 
debe basarse en la percepción de los hablantes de la lengua en cuestión. Un análisis 
descriptivo difícilmente comprobará que tal valor es realmente significativo para el 
hablante, ya que sólo permite analizar la producción lingüística. El fenómeno de percepción 
difícilmente se verá reflejado en un estudio únicamente descriptivo, ya que la producción 
no corresponde completamente a la percepción. 
Existen algunos trabajos de corte experimental que han estudiado la percepción de 
este fenómeno. No obstante, las diferencias entre los resultadosde los experimentos han 
13 
 
impedido que se defina un umbral de percepción tonal definitivo. Mientras que unas 
propuestas señalan que el umbral oscila entre 0.5 y 2 semitonos, otros afirman que se 
necesitan 9 semitonos para que una variación en la F0 se perciba (Bechem, 1937). Las 
diferencias tan pronunciadas entre los resultados pueden deberse a que se analizaron en 
lenguas diferentes o, bien, a las variaciones metodológicas entre los diseños experimentales 
de cada propuesta. Pamies et al. (2001) encuentran que estas variaciones metodológicas 
representan un problema y proponen que en futuros estudios se siga un método en común. 
Y es que factores como el tamaño de la muestra pueden afectar los resultados más de lo que 
se podría esperar. 
 Del mismo modo, hay otros elementos prosódicos que podrían influir en la 
percepción tonal. Ladefoged explica que: 
So far we have been assuming that differences in tone and intonation are realized 
simply by the pitch. But, from a speaker’s point of view, the phonetic correlate of 
pitch may be specific adjustments of the laryngeal muscles that control pitch. These 
laryngeal adjustments could be said to be what the speaker is aiming at when trying 
to produce a particular tone or intonation contour. As a result, some of variations in 
pitch that are detected by a perfect pitch tracking system may be irrelevant from a 
phonological point of view. (Ladefoged, 2003: 23) 
 
Son varios los recursos prosódicos que intervienen en el habla: la duración e 
intensidad de las unidades, los movimientos tonales a lo largo de la F0 y otros aspectos 
como las pausas y los alargamientos (Martín Butragueño, 2008: 160). Cada uno de estos 
elementos se estudia de forma objetiva, por lo que se recurre a valores fijos al contrastarlos. 
De este modo se establecen diferentes niveles de intensidad, duración, etc. El debate reside 
en que, en la mayoría de los casos, no hay una forma de probar que estos parámetros sean 
realmente percibidos por los hablantes. Por ello es necesario el trabajo de corte 
experimental, en el que se establecen umbrales diferenciales en la percepción de estos 
elementos prosódicos. 
 La psicofísica define un umbral diferencial (ΔE) como una diferencia mínima 
necesaria para ser reconocida. Asimismo, la percepción es la forma en que el cerebro 
decodifica los estímulos que recibe. La percepción de los estímulos lingüísticos está 
condicionada no sólo por la capacidad física de los hablantes, sino también por su lengua. 
En el contexto fonemático, por ejemplo, es común adaptar fonemas de otras lenguas al 
14 
 
sistema propio. Y no es que el cerebro sea incapaz de reconocerlos, sino que la lejanía con 
otras lenguas influye en la percepción. 
En prosodia, el umbral de percepción entonativa sería la diferencia mínima de la 
frecuencia fundamental que fuera reconocida por un miembro de la comunidad lingüística. 
Por ello es importante realizar este tipo de estudios para el caso específico del español del 
centro de México y comparar los resultados con los que se han obtenido para otras lenguas 
y para otras variedades del español. En esta tesis se trabajará el umbral de percepción como 
el punto de inflexión dentro de la distribución de los datos. Este punto de inflexión dejará 
por debajo las diferencias que dificilmente se percibieron, y por encima aquellas que se 
percibieron en su mayoría. Cuando se hable del umbral de percepción de las diferencias 
tonales, se hará referencia a este punto de inflexión. 
 
Estudiar la curva melódica es, por sí misma, una tarea complicada. Incluso la medición de 
ésta, que sería el primer paso para su análisis, involucra varias discusiones vigentes. Una de 
ellas es establecer una medida para el umbral de percepción, aunque existe otro debate que 
ha estado sobre la mesa desde hace algunas décadas: ¿qué escala es mejor para el análisis 
prosódico? 
 Para poder analizar cuantitativamente la percepción y establecer las escalas más 
apropiadas es necesario recurrir al trabajo de la psicofísica. Esta disciplina oscila entre el 
campo de la física y la psicología y su objeto de estudio es la relación que existe entre la 
magnitud de los estímulos y la percepción de éstos. La psicofísica nace a principios del 
siglo XIX gracias a los estudios de Ernst Heinrich Weber y Gustav Theodor Fechner 
(Johnson, Hsiao & Yoshioka, 2002). El debate sobre las escalas puede remitirse a ellos. La 
ley Weber-Fechner establece que la percepción de un estímulo es proporcional a su 
magnitud (Johnson, Hsiao & Yoshioka, 2002). En términos acústicos, la ley se puede 
ejemplificar de la siguiente manera: cuando contrastamos una conversación normal con una 
conversación en susurro, una diferencia de 3 semitonos es fácilmente percibida. Sin 
embargo, en un concierto, donde el sonido alcanza una intensidad mayor, la misma 
variación de 3 semitonos difícilmente se reconoce. Es decir, que mientras el contexto 
acústico sea más intenso, las variaciones tonales deberán ser mayores para que se perciban, 
mientras que si el contexto acústico es de menor intensidad, se podrán percibir variaciones 
15 
 
más pequeñas. Por ello la ley Weber-Fechner propone que la percepción se comporta de 
forma logarítmica y que una escala de este tipo es mejor para su estudio que una lineal 
(Johnson, Hsiao & Yoshioka, 2002). 
 En una escala lineal, los incrementos en las magnitudes a lo largo del eje de las x 
tienen el mismo tamaño y por eso se forma una línea recta. Por otra parte, los logaritmos se 
usan para simplificar los datos. El logaritmo de un número sería el exponente al cual hay 
que elevar la base de dicho número; en base 10, el logaritmo de 1,000 es 3, ya que si se 
eleva 10 a la tercera potencia (103), da 1,000 (Spiegel, 1995). Para ver la representación 
geométrica de una función lineal y una logarítmica, se muestra la figura 1.1. 
 
 
 
Figura 1.1. Función lineal y función logarítmica. La línea negra proyecta una 
ecuación logarítmica y la línea gris proyecta una ecuación lineal. 
 
 El uso de funciones logarítmicas sirve también para normalizar una proyección de 
datos (Spiegel, 1995). En los análisis prosódicos esto resulta útil, ya que la frecuencia 
fundamental presenta algunas alteraciones que dificultan su estudio y expresarla en una 
escala logarítmica ayuda a neutralizarlas. Esto se ejemplifica en la figura 1.2, donde se 
muestra la comparación entre el uso de una escala lineal y otra logarítmica para el 
enunciado Una vez en el interior, los agentes encontraron a tres de los niños (Llisterri, 
2015). 
16 
 
 
Figura 1.2. Curvas melódicas en Hz y st. Corresponden al enunciado Una vez en el interior, los 
agentes encontraron a tres de los niños, en voz masculina a la izquierda y en voz femenina a la 
derecha. (Tomado de Llisterri, 2015, en: 
http://liceu.uab.es/~joaquim/phonetics/fon_prosod/suprasegmentales_ 
melodia_entonacion.html#melodia_percepcion) 
 
 La tradición lingüística ha trabajado con escalas logarítmicas expresadas en hertzios 
(Hz) o en semitonos (st); la mayoría de los trabajos siguen esta tradición. No obstante, los 
avances tanto en prosodia como en psicofísica han permitido que se propongan otro tipo de 
escalas: las psicoacústicas. Dik J. Hermes y Joost C. van Gestel (1991), de cuyo 
experimento se hablará más adelante, encuentran que estas escalas funcionan mejor para 
estudiar la percepción lingüística. La escala psicoacústica oscila entre la lineal y la 
logarítmica. Cuando las magnitudes son bajas, se comportan de forma casi lineal, mientras 
que cuando aumentan se acercan a una proyección logarítmica. Este tipo de escalas ya se 
están usando en algunos estudios prosódicos, aunque generalmente se mencionan también 
las equivalencias en hertzios para que el lector no familiarizado con estas escalas tenga una 
referencia más cercana. Tal es el caso de “On the presence of final lowering in British and 
American English”(Arvaniti, 2007), donde la autora presenta sus datos en ERBs 
17 
 
(Equivalent Rectangular Bandwidth) con las equivalencias en hertzios. En música, por otro 
lado, se prefiere todavía una escala en semitonos. 
Rietveld y Gussenhoven (1985) decidieron que, como la frecuencia fundamental es 
un objeto de estudio muy importante en la prosodia, era necesario esclarecer algunos puntos. 
Así, diseñaron un experimento con el objetivo de corroborar que las diferencias tonales de 
1.5 semitonos fueran perceptibles e identificar qué escala funciona mejor en percepción, si 
en semitonos o en hertzios. Sus resultados indicaron que una diferencia de 1.5 semitonos es 
suficiente para su reconocimiento y que la F0 se modela mejor en una escala en semitonos 
que en una en hertzios. 
 Dik J. Hermes y Joost C. van Gestel (1991), unos años después, realizaron un 
experimento con el fin de identificar qué escala funciona mejor en el campo de la 
percepción: una escala lineal, logarítmica o psicoacústica. Su experimento consistió en 
presentar pares de estímulos resintetizados del enunciado /mamáma/. Cada estímulo 
proviene de la misma grabación, la cual se resintetizó para obtener diferentes F0 y 
conservar la duración e intensidad. La tarea consistió en que el informante debía igualar la 
F0 del par de estímulos. Las diferencias se presentaron en diferentes escalas: una en 
semitonos, otra en hertzios y la tercera en ERBs. Aunque los mismos informantes 
expresaron que la tarea era muy complicada, las pruebas se realizaron con éxito. 
 Los resultados del experimento apuntaron a que la escala con mejores resultados fue 
la de ERBs, la psicoacústica. Cuando se les dijo esto a los informantes, se sorprendieron, 
pues esperaban que los estímulos presentados en la escala de semitonos tuvieran un mejor 
resultado, ya que estaban acostumbrados a ella por su trayectoria en música. Los autores 
atribuyeron esto a que es diferente la percepción de estímulos musicales y estímulos 
lingüísticos, lo que es otro argumento a favor de usar una escala psicoacústica en el campo 
de la percepción. 
 Hasta hace unas décadas, se había llegado a la conclusión de que una escala 
logarítmica era la mejor opción para perfilar la curva melódica. Sin embargo, trabajos como 
el de Hermes y van Gestel (1991) han llevado a algunos investigadores a preferir el uso de 
escalas psicoacústicas como la expresada en ERBs. No obstante, por uniformidad en los 
estudios y por tradición, se siguen usando las escalas logarítmicas en semitonos, con mayor 
frecuencia, y en hertzios, con menor frecuencia. 
18 
 
 Sin embargo, la discusión que más interesa para los objetivos de esta tesis es la del 
umbral de percepción. Varios son los trabajos que se han hecho para identificar cuál es la 
diferencia tonal mínima necesaria para que un hablante la reconozca. Aunque en los 
análisis descriptivos de la curva melódica se está tomando como valor fijo los 1.5 
semitonos, se siguen haciendo trabajos experimentales para corroborar que éste 
corresponda con el umbral de percepción. 
 Los dos experimentos que se mencionaron anteriormente se realizaron con 
hablantes de holandés. Para el español peninsular, Pamies Beltrán, Fernández Planas, 
Martínez Celdrán, Ortega Escandell y Amorós Céspedes (2001) hicieron un experimento 
para ubicar la cantidad mínima necesaria para percibir las diferencias tonales de la curva 
melódica. Explican que en trabajos anteriores ya se había buscado este umbral, pero que las 
metodologías diferían entre sí y los resultados eran variados. Algunos autores encontraron 
que el umbral estaba entre 0.5 y 2 Hz, mientras que otros reportaron que los informantes 
necesitaron una diferencia mayor a 7 semitonos para reconocerla con seguridad. Con el fin 
de unificar algunos criterios metodológicos y de estudiar el fenómeno en el español, Pamies 
et al. (2001) diseñaron otro experimento. 
 Decidieron usar estímulos bisílabos del tipo /ba.ba/, en el cual resintetizaron la 
segunda sílaba, modificando únicamente la F0 para aislar la variable de otros factores que 
pudieran influir en el reconocimiento de las diferencias, como la intensidad o la duración. 
Antes de aplicar el experimento a su grupo de informantes, decidieron pilotearlo con 
músicos para asegurarse de que funcionara como fue planeado. Al ver que los músicos 
realizaron con éxito la tarea, llegaron a la conclusión de que ésta era viable. 
 Como la prueba era corta, eligieron un grupo de 100 informantes compuesto por 
estudiantes de lingüística. En su artículo (Pamies et al., 2001) no se indica si se aplicó el 
experimento informante por informante o si usaron audífonos. Sólo explican que la 
instrucción fue que indicaran en una hoja de papel si las sílabas del estímulo eran iguales o 
diferentes. Tras analizar los resultados observaron que las diferencias por debajo de 1 
semitono difícilmente se reconocieron y las mayores a 2 semitonos tuvieron un 
reconocimiento lo suficientemente alto como para concluir que el umbral se encontraba 
entre 1 y 2 semitonos. 
19 
 
 En sus conclusiones explicaron que lo más conveniente era considerar dos tipos de 
umbrales: el funcional y el perceptivo. La diferencia que proponen radica en que el umbral 
funcional representa la capacidad auditiva. Según sus resultados, este umbral sería de 1 
semitono. Sin embargo, retoman los resultados de Rossi (1999), donde se encuentra que 
para el francés se necesita una diferencia mayor al 15% (respecto al movimiento anterior de 
la curva melódica) para percibir las variaciones tonales. Así explican el umbral perceptivo, 
el cual depende del sistema lingüístico más que de la capacidad auditiva. Con los resultados 
de Rossi (1999) se infiere ese valor relativo del 15% corresponde al comportamiento 
prosódico del francés, y, dado que otras lenguas tendrán un comportamiento diferente, no 
se puede aplicar tal valor para otros sistemas lingüísticos. No obstante, tomar valores 
relativos llevaría a complicaciones metodológicas cuando se quisiera hacer un estudio 
comparativo entre diferentes lenguas. Por ello, Pamies et al. (2001) sitúan el umbral 
perceptivo en un rango entre 1 y 2 semitonos y, para fines prácticos, coinciden con que se 
puede seguir usando 1.5 semitonos como valor fijo, ya que está entre los dos extremos del 
umbral perceptivo. 
Además, explican que un hablante difícilmente tendrá el mismo rendimiento 
auditivo, ya que éste está sujeto a factores como el cansancio, el ruido, la concentración, 
etc., por lo que concluyen que, aunque para fines prácticos es necesario un valor fijo, es 
necesario tener presente que la percepción de las diferencias tonales de la F0 es más un 
rango que un punto invariable. 
 Para este proyecto de tesis se decidió usar como uno de los principales referentes y 
base el experimento de Pamies et al. (2001) ya que, además de que es relativamente 
reciente, tiene una metodología clara y se aplicó a una variedad del español, por lo que vale 
la pena realizar una réplica para el español del centro de México y comparar los resultados. 
Así, además de realizar los experimentos que nos permitan un contraste entre diferentes 
contextos lingüísticos, en esta tesis se diseñó un experimento basado en el de Pamies et al. 
(2001). 
 
* * * 
 
20 
 
El funcionamiento del oído humano y la percepción de los sonidos es un tema que compete 
a múltiples campos de estudio. Es verdad que la percepción del habla y de los elementos 
prosódicos son intereses de la lingüística. No obstante, la percepción de algunos elementos 
prosódicos como los relacionados con las emociones es un área que la psicología ha 
trabajado desde hace ya varias décadas. La percepción es un campo de estudio que ha sido 
estudiado más por la psicología que por otras ciencias y por ello es importante revisar este 
antecedente y considerar especialmente su metodología. 
En música, por otro lado, uno de los temas más relevantesy en constante discusión 
es la relación entre la percepción y la producción de estímulos musicales. Aunque los 
sonidos musicales y los lingüísticos no se comportan igual, hay elementos que pueden dar 
pistas para esta investigación. 
Respecto a la física, la acústica es una disciplina con una amplia trayectoria de 
estudio y resulta fundamental retomar algunos aspectos de esta área para aplicarlos en los 
estudios de percepción prosódica. 
 Al compartir el mismo objeto de estudio, es entendible que los límites entre estas 
disciplinas parezcan difusos. La psicoacústica, por ejemplo, es una rama de la psicología y 
la física que también es estudiada en trabajos lingüísticos y musicales. Y es que la 
percepción de estímulos auditivos es un problema que, para poder abordarlo, necesita de 
estas cuatro aproximaciones. Por ello es necesario explicar brevemente lo que se ha hecho 
desde sus diferentes perspectivas. 
 La psicoacústica estudia la percepción de los estímulos sonoros. Pero hay diferentes 
tipos de estímulos sonoros. Los musicales y lingüísticos, que son los más estudiados, son 
diferentes entre sí y la percepción de éstos se comporta de formas distintas. Sin embargo, 
tanto en música como en lingüística hay un amplio repertorio de trabajos experimentales 
cuyo objeto de estudio es la percepción de las diferencias tonales. En los estudios 
experimentales de música, la relación entre producción y percepción se ha estudiado con 
más énfasis en las últimas décadas, con el fin de saber si existe una relación significativa 
entre la percepción tonal y su producción. En teoría, una producción óptima en términos 
musicales se alcanza cuando hay una buena percepción de las diferencias tonales (Geringer, 
1988). 
21 
 
Los trabajos anteriores sobre percepción musical apuntan a que la percepción de 
tonos agudos es menos precisa que la de los tonos graves (Geringer, 1988). Respecto a la 
duración, se ha observado que aquellos estímulos donde el tempo es más lento se reconocen 
mejor que aquellos cuyo tempo es más rápido (Geringer, 1988). Con el fin de corroborar 
estos supuestos, John M. Geringer (1988) realizó un experimento en el cual observó la 
relación entre la producción de patrones ascendentes en escalas musicales y su percepción. 
Para ello, usó estímulos musicales cuyo contraste radicaba en la diferencia entre tonos 
ascendentes y tonos planos. Los experimentos se presentaron a un grupo de 96 sujetos 
compuesto por estudiantes y graduados de la Escuela de Música de la Universidad Estatal 
de Florida. Estos sujetos se dividieron en diferentes grupos dependiendo del instrumento 
que practicaran, aunque a todos se les aplicaron las pruebas completas. Sus resultados 
apuntaron a que se reconocen mejor las diferencias ascendentes que las planas. Pero la 
investigación en música no se puede aplicar directamente a cuestiones lingüísticas, ya que 
la percepción de estímulos musicales se comporta de modo diferente a la percepción del 
habla. Acaso esto es porque, como se mencionó, en la prosodia se manifiestan diferentes 
fenómenos y la percepción recae en todos ellos, no sólo en los cambios tonales. No 
obstante, los resultados de esta investigación musical son interesantes, ya que en la 
producción lingüística los cambios ascendentes y descendentes se presentan en contextos 
lingüísticos diferentes e incluso su oposición puede resultar en un rasgo distintivo entre 
pares mínimos. Por ejemplo, la principal diferencia entre la curva melódica de una pregunta 
absoluta y su par mínimo declarativo recae en que la F0 de la interrogativa es ascendente al 
final y la de la declarativa se mantiene. No obstante, hay otras pistas prosódicas que 
influyen en la distinción de este par (Martín Butragueño, 2014). 
Es verdad que el trabajo experimental sobre la percepción entonativa no es escaso. 
De hecho, como se puede ver, hay muchas bases de las cuales partir para futuras 
investigaciones. Sin embargo, todavía falta mucho para saber exactamente cómo funciona 
la entonación en cuestiones perceptuales y qué tanto varía entre diferentes lenguas. 
Después de ver lo que se ha hecho en trabajos anteriores, se decidió enfocar esta 
tesis a observar la percepción de las diferencias tonales, así como su comportamiento en 
diferentes contextos lingüísticos. 
 
22 
 
 
23 
 
CAPÍTULO 2 
METODOLOGÍA 
 
En este capítulo se expondrá la metodología del diseño esperimental de este proyecto de 
tesis. Primero se explicarán las pruebas preliminares y, posteriormente, el diseño de los 
experimentos definitivos. También se explicarán cuestiones relacionadas con la aplicación 
de los experimentos, los informantes y el tamaño de la muestra. El método de análisis de 
resultados se desarrollará en el capítulo 3. 
 
Con el fin de encontrar el umbral de percepción1 de los cambios tonales de la F0, se 
desarrollaron cuatro experimentos. Éstos pueden separarse en dos fases. La primera incluye 
estímulos de diferentes contextos lingüísticos: uno fonemático, uno silábico y uno frástico. 
Se decidió hacer esta división para observar si el contexto de información lingüística 
influye en la percepción de las variaciones tonales. Para una comparación más transparente 
entre esta investigación y los trabajos que se han hecho sobre el tema, la segunda fase 
corresponde a estímulos bisilábicos y en ella se retoma el experimento de Pamies et al. 
(2001), en el que se muestran dos sílabas con variaciones tonales en sus F0 y los 
informantes deben identificar si las perciben como iguales o diferentes. Asimismo, cada 
fase tiene un experimento con estímulos de nivel —donde la curva melódica en la sección 
resintetizada es plana— y uno con estímulos de contorno —donde la curva melódica en la 
sección resintetizada es ascendente o descendente. En este capítulo se muestra en detalle el 
proceso del diseño experimental y de la aplicación de las pruebas. 
 
2.1. PRUEBAS PRELIMINARES 
Para el diseño de los experimentos se tomaron en cuenta los trabajos anteriores, como el de 
Pamies et al. (2001). Sin embargo, fue necesario aplicar algunas pruebas preliminares para 
confirmar que los informantes realizaran la tarea correcta y que los resultados reflejaran los 
 
1 Aunque esto se mencionó en el capítulo 1 y se explicará a detalle en el capítulo 3, es importante 
aclarar que, para esta tesis, se abordará el concepto de umbral de percepción como el punto de 
inflexión de los datos donde, por debajo de este punto estén las diferencias tonales que difícilmente 
se percibieron y por encima de él aquellas que se percibieron sin dificultad. 
24 
 
objetivos del experimento. De igual forma, gracias a estas pruebas se corrigieron algunos 
detalles metodológicos que se explicarán en este capítulo. 
 Desde el inicio se decidió que los estímulos partieran de una grabación de voz 
natural y se resintetizarían para obtener las diferencias tonales deseadas. Se decidió así para 
que los informantes escucharan sonidos que pertenecen a su lengua y no creyeran que se 
trataba de sonidos no lingüísticos. A medida que se hicieron correcciones de una prueba 
preliminar a otra, las escalas de diferencias tonales y la cantidad de estímulos fue variando. 
 Todas las pruebas piloto tuvieron la misma instrucción: “Tras escuchar el par de 
sonidos que se presenten, presione la tecla Z si considera que son iguales o la tecla M en 
caso de que sean diferentes”. No se les explicó en qué debían fijarse para hacer esta 
distinción, ya que esa explicación podría influir en su percepción. Y dado que el único 
elemento en que se diferenciaban los estímulos fue la altura tonal, no es probable que se 
hayan fijado en otro rasgo. Asimismo, siempre se aplicaron de forma individual, con 
audífonos y con la supervisión de que los informantes se concentraran y estuvieran en 
condiciones óptimas para presentar las pruebas. 
 Es importantedestacar que, aunque la batería final se presentó a veinte sujetos, las 
pruebas preliminares se aplicaron a pequeños grupos de informantes, ya que el propósito de 
estas pruebas era únicamente mejorar la metodología para los experimentos definitivos. Así, 
se muestran las características de cada prueba preliminar y las discusiones que llevaron a 
modificar los experimentos para obtener los que se aplicaron finalmente para la 
investigación. 
 
2.1.1. Primera prueba piloto 
Para la primera prueba sólo se realizaron experimentos para el contexto fonemático /e/, 
aunque desde el inicio se plantearon los diferentes contextos lingüísticos para la batería 
final. El objetivo de esta prueba era el de verificar que el experimento fuera viable y que las 
diferencias tonales entre los estímulos fueran perceptibles para los informantes. Por tal 
motivo, y por practicidad, sólo se usaron estímulos con voz femenina2. En esta fase de la 
 
2 Se decidió que las grabaciones fueran de voz femenina ya que se probablemente se necesitaría 
hacer modificaciones y volver a grabar los estímulos. Era necesario que quien prestara su voz 
estuviera disponible en futuras ocasiones y para garantizar dicha disponibilidad me grabé a mí 
misma. 
25 
 
investigación se consideró pertinente hacer diferentes experimentos del mismo contexto 
lingüístico pero con escalas diferentes para ver si el grado de “dificultad” de los 
experimentos influiría en los resultados. Así, hubo dos fases: la primera, con tres grados de 
dificultad con estímulos de nivel y la segunda con dos experimentos, uno con tonos de 
nivel y otro con tonos de contorno3. Antes de cada una de las fases se les aplicó un 
experimento introductorio para que se familiarizaran con la mecánica. Estas pruebas se 
explicarán a detalle posteriormente. 
 La grabación que sirvió de estímulo base corresponde a la vocal /e/ de una mujer de 
22 años. Dura 200 ms y su curva melódica se mantiene en 1435 Hz aproximadamente. Para 
la manipulación de los estímulos se usó una escala en semitonos tanto en las pruebas 
preliminares como en los experimentos definitivos, pero se mencionarán las medidas de las 
grabaciones base tanto en hertzios como en semitonos, para tener la referencia en hertzios. 
 Posteriormente se resintetizó la grabación en Praat (Boersma & Weenink, 2015) para 
eliminar las variaciones tonales y obtener una curva melódica completamente uniforme. Al 
igual que en todas las pruebas, sólo se modificó esto para no alterar otros elementos que 
influyeran en la distinción de los estímulos, como la intensidad o la duración. 
 Como se mencionó, con el fin de que los informantes se familiarizaran con los 
experimentos se creó una prueba introductoria a manera de práctica, para la cual se 
obtuvieron siete estímulos que varían en 3 st y escalan en 1 st a partir de la base de 1435 Hz. 
Para obtener veinte estímulos, en el script se programaron repeticiones aleatorias de los 
siete estímulos resintetizados, que en total sumaran veinte. Esta prueba se presentó una vez 
antes del resto de los experimentos. 
 Después de la prueba de entrada se aplicó la fase de grados de dificultad, para la cual 
se diseñaron tres experimentos. La grabación base corresponde a la vocal /e/ de una mujer, 
cuya duración es de 200ms y se mantiene aproximadamente en 1435 Hz. Es importante 
destacar que para todos los experimentos, exceptuando el introductorio, se establecieron 
periodos de descanso cada veinte estímulos, para que el informante no perdiera la 
concentración por agotamiento. Después de haber descansado el tiempo que el informante 
considerara necesario, se continuaba con la prueba. 
 
3 Se entiende por tonos de nivel aquellos cuya curva melódica es constante pues no hay variaciones 
significativas en su frecuencia fundamental, y por tonos de contorno a aquellos que sí tienen 
variaciones ascendentes o descendentes en su frecuencia fundamental (Dryer & Haspelmath, 2013) 
26 
 
 A continuación se explica la fase de los grados de dificultad. 
i. Prueba A. Ésta es la del grado más bajo de dificultad. Consiste en siete estímulos que 
varían cada uno en 1.5 st en una escala total de 9 st. La combinación de los 
estímulos resultó en 98 ítems que se presentaron de forma aleatoria. Tal cifra se dio 
ya que se presentó dos veces cada combinación posible. Se estableció que los 
estímulos variaran en 1.5 st, ya que la tradición prosódica toma esta medida como 
rango mínimo para establecer que una diferencia tonal es significativa y por lo tanto, 
teóricamente, no habría mayor dificultad para percibir las diferencias entre los 
estímulos de este grupo. 
ii. Prueba B. La de grado medio de dificultad, donde los siete estímulos varían en 1 st en 
una escala de 6 st. La cantidad de combinaciones fue la misma que para la prueba A 
y, de igual forma, se presentaron aleatoriamente. 
iii. Prueba C. Esta prueba se previó como la más difícil. Los siete estímulos de este 
experimento escalan en 0.5 st en una escala de 3 st. Asimismo, la cantidad de ítems 
y el orden en que aparecieron fue igual que en las pruebas anteriores. 
 Cabe mencionar que en ningún momento se mencionó a los informantes que había 
diferentes grados de dificultad entre los experimentos, para no influir en su desempeño. Y 
el orden en que se aplicaron las pruebas fue aleatorio para cada informante. 
 Al concluir la fase de grados de dificultad, se presentaron los dos experimentos cuyo 
objetivo fue el de estudiar las diferencias perceptuales entre los tonos de nivel y los de 
contorno. Para ello, se consideró pertinente diseñar dos experimentos que fuesen 
exactamente iguales y cuya única variante fuera la naturaleza de su curva melódica –que se 
mantuviera con la misma altura tonal a lo largo del estímulo o que tuviera una elevación o 
descenso desde el inicio hasta el final. La grabación que se utilizó para los estímulos es la 
misma que para la fase de grados de dificultad. 
i. Prueba de nivel. Para este experimento las curvas melódicas de los estímulos se 
resintetizaron de forma que se mantuviera sin variaciones tonales desde el inicio hasta 
el final de la curva, es decir, que fuera plana. El estímulo base tiene una F0 de 1435 
Hz y se ubica en el número 4 en la tabla 2.1. Se usaron siete estímulos como base 
cuyas diferencias tonales se distribuyen de la siguiente manera: 
 
27 
 
Estímulo Diferencias en st 
respecto al 
estímulo base. 
7 +2 st 
6 +1.5 st 
5 +1 st 
4 (base) 0 st 
3 -1 st 
2 -1.5 st 
1 -2 st 
Tabla 2.1. Distribución de los estímulos de la prueba de nivel. Primera prueba 
piloto. 
 
Las combinaciones de los siete estímulos resultaron en un total de 98 ítems que 
aparecieron de forma aleatoria durante el experimento. 
ii. Prueba de contorno. Al igual que para la fase de nivel, el experimento contó con 98 
ítems que partieron de la combinación de los siete estímulos bases cuya organización 
se explica en la tabla 2.2. Como se observa en ella, el estímulo base (4) tiene una 
curva melódica plana porque no presenta variaciones tonales. El resto de los 
estímulos son de contorno pues presentan variaciones. 
 
Estímulo Diferencias en st 
respecto al inicio de 
la curva 
7 +2 st 
6 +1.5 st 
5 +1 st 
4 (base) 0 st 
3 -1 st 
2 -1.5 st 
1 -2 st 
Tabla 2.2. Distribución de los estímulos de la prueba de contorno. Primera prueba 
piloto. 
 
 Como se explicó, la única diferencia entre la prueba de nivel y la de contorno es que 
los estímulos de la segunda tuvieron curvas ascendentes o descendentes según el caso en 
particular. Al igual que en la fase de grados de dificultad, el orden en que se aplicaron las 
dos pruebas varió para cada informante para eliminar un posible sesgo en los resultados. 
 Después de la aplicación de las pruebas se consideró pertinente pedir la opinión de 
los informantes para obtener una retroalimentación.Ellos coincidieron en que los estímulos 
28 
 
de la prueba C les parecían todos iguales; sin embargo, no consideraron que la prueba fuera 
difícil o agotadora. Tras revisar sus resultados, fue interesante encontrar que la prueba que 
tuvo un mayor número de reconocimiento fue la prueba C; los estímulos de la prueba B 
tuvieron un reconocimiento intermedio y la prueba A fue la que menor número de 
reconocimientos tuvo. 
 
2.1.2. Segunda prueba piloto 
Después de analizar la primera prueba, se pensó que había que modificar la escala de las 
diferencias tonales, así que en la segunda prueba se planearon dos escalas diferentes. 
También se introdujo el segundo contexto silábico, que se representó con /ɡe/. Como se 
introdujo una segunda escala y otro contexto lingüístico, esta prueba constó de diez 
experimentos, por lo que se aplicó en dos sesiones para cada informante. Debido al gran 
número de experimentos, para estas pruebas ya no se aplicó el experimento introductorio. 
Al igual que en la primera prueba, el orden en que se aplicaron los experimentos fue 
aleatorio en cada informante. 
 La única modificación que se hizo en los estímulos fue la duración de éstos. En la 
primera prueba, específicamente en el experimento de contorno, el reconocimiento de las 
diferencias fue muy bajo. Esto se atribuyó a que los estímulos duraban muy poco (200 ms) 
y por ellos se decidió que en esta segunda prueba los estímulos durarían 250 ms. En una 
primera discusión se planteó que sólo los estímulos de contorno duraran 250 ms y que el 
resto se mantuviera en 200 ms. Sin embargo, dado que esto añadiría un sesgo, al analizar 
los resultados no habría una total certeza de que lo encontrado respondiera sólo a las 
diferencias tonales y cabría la duda de si las diferencias en la duración influyeron en el 
reconocimiento en los estímulos. Para evitar ese problema, se decidió que lo óptimo sería 
que todos los estímulos, tanto de /e/ como de /ɡe/ duraran 250 ms. Enseguida se presentan 
las características de los experimentos. 
 
 
 
 
 
29 
 
Prueba /e/: 
i. Escala de siete estímulos. Esta prueba es exactamente igual a la primera prueba 
piloto. Incluye la fase de grados de dificultad y la de estímulos de nivel y de 
contorno. Aunque la duración de los estímulos cambió, como ya se mencionó, la 
distribución de los experimentos fue la misma que en la primera prueba piloto, 
tanto para la fase de grados de dificultad como para la fase de contorno. 
ii. Escala de cinco estímulos. Esta escala se introdujo, porque al tener menos 
estímulos, es posible tener más repeticiones que en la misma prueba y tener casi el 
mismo número de ítems. Como se mencionó, la escala de siete semitonos resultó en 
98 ítems. En esta prueba, con cinco estímulos, hubo 25 combinaciones de pares 
posibles. Cada una de ellas se repitió cuatro veces, lo que resultó en 100 ítems. 
Tener más repeticiones de los estímulos permite que el análisis estadístico de los 
resultados sea más confiable. A continuación se presentan las dos fases de esta 
escala. 
 Para la fase de grados de dificultad la dinámica es la misma que en la escala 
de siete estímulos, pero los ítems se distribuyen de la siguiente manera: 
a. Prueba A: Es el grado de dificultad más fácil. Consta de cinco estímulos que 
oscilan en 6 st, por lo que cada uno varía en 1.5 st. 
b. Prueba B: Es el grado de dificultad intermedia. De igual forma, tiene cinco 
estímulos, pero la escala abarca 4 st y las variaciones son de 1st. 
c. Prueba C: Es el grado más difícil, donde las variaciones son de 0.5 semitonos y 
la escala de los cinco estímulos oscila en 2 st. 
 La fase de grados de dificultad tiene la misma dinámica que la de escala de 
siete estímulos, pero dado que sólo fueron cinco estímulos base, la distribución 
también cambió. 
a. Prueba de nivel. Para este experimento, el estímulo base tiene una F0 de 1460 Hz 
y se muestra en el número 3 en la tabla 2.3. Se usaron siete estímulos como base, 
cuyas diferencias tonales se distribuyen de la siguiente manera: 
 
 
 
 
 
30 
 
Estímulo Diferencias en st 
respecto al 
estímulo base. 
5 +1.5 st 
4 +1 st 
3 (base) 0 st 
2 -1 st 
1 -1.5 st 
Tabla 2.3. Distribución de los estímulos de la prueba de nivel. Segunda 
prueba piloto. 
 
b. Prueba de contorno. El estímulo base de este experimento es el único cuya curva 
melódica es plana pues se mantiene en 1460 Hz. Los otros cuatro estímulos 
presentan las elevaciones y descensos correspondientes al final de la curva. La 
distribución de éstos puede verse en la siguiente tabla: 
 
Estímulo Diferencias en st 
respecto al inicio de 
la curva 
5 +1.5 st 
4 +1 st 
3 (base) 0 st 
2 -1 st 
1 -1.5 st 
Tabla 2.4. Distribución de los estímulos de la prueba de contorno. Segunda prueba 
piloto. 
 
 
Prueba /ɡe/: 
Para eliminar variaciones metodológicas que provocaran sesgos en los resultados, el diseño 
de esta prueba es exactamente igual que el del contexto fonemático. La única variación 
entre estos dos contextos es la grabación base. Se decidió que la sílaba que representaría al 
contexto silábico fuera /ɡe/, para que la vocal fuera la misma que en el contexto previo y 
porque el fonema consonántico /ɡ/ no altera significativamente la F0 de las vocales que le 
siguen en la emisión, así que no representaría mayor dificultad al resintetizar los estímulos. 
Para obtener la sílaba /ɡe/ de este contexto también se usó una voz femenina. Se cuidó que 
la duración de estos estímulos también fuera de 250 ms y la distribución de las escalas y la 
aplicación de los experimentos fue la misma que para /e/. 
31 
 
 Es necesario mencionar que, al igual que en la primera prueba piloto, en todos los 
experimentos hubo periodos de descanso. Éstos se dieron, también, cada veinte estímulos. 
Sin embargo, a pesar de estos periodos de descanso y de que las pruebas se aplicaron en dos 
sesiones, los informantes coincidieron en que eran demasiados experimentos y que 
resultaba difícil mantener la concentración. 
 Al revisar los resultados se observó que, efectivamente, el nivel de reconocimiento 
de las diferencias era muy bajo y, aunque la duración de los estímulos ayudó a que se 
percibieran más diferencias que en la primera prueba piloto, se decidió que era necesario 
hacer varias modificaciones al diseño de los experimentos. 
 
2.1.3. Tercera prueba piloto 
Esta prueba se pensó en un principio como el experimento definitivo, aunque 
posteriormente se realizaron algunas últimas modificaciones que se explicarán más adelante. 
Ya que los estímulos de la segunda prueba piloto fueron satisfactorios, se decidió que ese 
aspecto no se modificaría. Sin embargo, se replanteó la distribución de las pruebas. Con el 
fin de tener una menor cantidad de experimentos y que estos siguieran cumpliendo con las 
tareas de las pruebas anteriores, se decidió optimizar la distribución de los estímulos. 
 Se consideró que tener una fase de grados de dificultad no era necesario y que la 
prueba de estímulos de nivel, con las respectivas modificaciones, podría cumplir la misma 
función que la de los grados de dificultad. Asimismo, se introdujo el tercer contexto 
lingüístico y el experimento con estímulos bisilábicos basado en el trabajo de Pamies et al. 
(2001). De esa forma, se obtuvieron ocho experimentos: el fonemático, silábico y frástico 
de estímulos de nivel, el bisilábico de estímulos de nivel y los mismos cuatro pero con 
estímulos de contorno. 
i. Prueba de contextos lingüísticos. Como se mencionó, el estímulo base de 250 ms de 
voz femenina se mantuvo. Sin embargo, como se contempló como el experimento 
definitivo, se agregó también la grabación de la voz masculina, cuidando que la 
intensidad fuera lo más similar posible a la de la voz femenina y también que su 
duración fuera de 250 ms. Aunque jamás se planeó oponer un estímulo de voz 
femenina con uno de voz masculina porque la identificación sería obvia, se cuidóque 
fueran similares para que hubiera uniformidad en el experimento. 
32 
 
 El objetivo de los grados de dificultad era tener diferentes rangos en las 
diferencias tonales, pero después de analizar las pruebas, se llegó a la conclusión de 
que esto se podría lograr sin necesitar de hacer tantos experimentos. Por ello, se 
crearon cinco estímulos cuyas combinaciones resultaron en trece diferencias tonales, y 
cada una de las cuales se repitió ocho veces, lo cual dio un total de 104 ítems de voz 
femenina y 104 de voz masculina. En total, cada uno de los experimentos de contextos 
lingüísticos estaba formado por 208 ítems. En la tabla 2.5 se explica la distribución de 
los estímulos para un solo género (104 ítems): 
 
Diferencia en 
semitonos entre los 
dos estímulos 
Combinación de los 
estímulos4 Repeticiones Total de ítems 
-3 st 5-1 8 8 
-2.5 st 5-2 4 8 4-1 4 
-2 st 4-2 8 8 
-1.5 st 5-3 4 8 3-1 4 
-1 st 4-3 4 8 3-2 4 
-0.5 st 5-4 4 8 2-1 4 
0 st 
5-5 2 
8 
1-1 2 
3-3 2 
2-2 1 
4-4 1 
0.5 st 4-5 4 8 1-2 4 
1 st 3-4 4 8 2-3 4 
1.5 st 3-5 4 8 1-3 4 
2 st 2-4 8 8 
2.5 st 2-5 4 8 1-4 4 
3 st 1-5 8 8 
Tabla 2.5. Distribución de los estímulos para las pruebas de contextos lingüísticos. 
 
4 En el experimento hay sólo cinco estímulos. El número 1 corresponde a -1.5 st, 2 a -1 st, el 3 a 0 st, 
el 4 a 1 st y el 5 a 1.5 st. Las diferentes combinaciones entre ellos proporcionan 13 escalones en 
semitonos. Se distribuyeron de dicha manera para que en el experimento hubiera la misma cantidad 
de repeticiones para cada escalón y que no hubiera una diferencia tonal que tuviera mayor 
frecuencia de aparición que otra, ya que esto provocaría alteraciones en los resultados. 
33 
 
 Como se ve en la tabla 2.5, se cubren todas las diferencias tonales que en la 
prueba de grados de dificultad, por lo que no afectó su eliminación. Además, se cuidó 
que cada una de esas diferencias tuviera la misma cantidad de repeticiones, porque tras 
analizar las pruebas previas se descubrió que, aunque los estímulos tenían las mismas 
repeticiones, había diferencias tonales con más apariciones que otras y eso podría ser 
un problema al analizar los resultados. 
 A continuación se explica cada uno de los contextos de la prueba: 
a. Contexto fonemático. Como ya se mencionó, se continuó con la vocal /e/ para 
este contexto, y los cinco estímulos base que se usaron fueron los mismos que 
para la segunda prueba piloto, por lo que los estímulos de nivel se explican con 
la tabla 2.3 y los de contorno con la tabla 2.4. Al igual que en las pruebas 
anteriores, se aplicaron de forma separada, por lo que se obtuvo un experimento 
con estímulos de nivel de la vocal /e/ y otro con estímulos de contorno de la 
misma vocal, cada uno con 208 ítems, como ya se mencionó. 
b. Contexto silábico. Al igual que en el contexto fonemático, se conservaron los 
mismos cinco estímulos base de la segunda prueba con la sílaba /ɡe/ y sólo 
cambió la distribución de los estímulos para que cada contexto lingüístico 
coincidiera con lo planteado en la tabla 5 tanto para el experimento de nivel 
como para el de contorno. 
c. Contexto frástico. Como este contexto no se incluyó en las pruebas anteriores, se 
tuvo que hacer una nueva grabación para este experimento. Se decidió que la 
frase debía ser breve y que la última sílaba, que sería la resintetizada, debía ser 
sonora. Por ello se eligió La luna. Esta grabación dura 600 ms, pero la sílaba que 
se resintetizó fue sólo /na/ y su duración es de 250 ms, como en los contextos 
anteriores. De igual forma, se obtuvieron cinco estímulos para conseguir los 208 
ítems del experimento de nivel y los otros 208 para el de contorno. 
 
ii. Prueba de estímulos bisilábicos. Ya que estos experimentos están basados en el de 
Pamies et al. (2001), es conveniente contrastar algunos matices en las dos 
metodologías. En primera instancia, Pamies et al. (2001) sólo hicieron una prueba con 
estímulos de nivel. Sin embargo, para que el experimento de esta tesis fuera 
34 
 
contrastable con aquellos de la fase de contextos lingüísticos, se decidió agregar la 
prueba de contorno. 
 Tanto el experimento de Pamies et al. (2001) como el de esta investigación 
consisten en un test de audición de secuencias bisílabas donde los informantes deben 
indicar si escuchan sílabas iguales o diferentes entre sí. Los estímulos parten de 
grabaciones de habla natural de hombre y de mujer, resintetizadas igual que los de la 
fase anterior. Los estímulos de Pamies et al. (2001) fueron resintetizados con el ASL 
de KAY, mientras que los del presente trabajo se modificaron con Praat (Boersma & 
Weenink, 2015). No obstante, esta diferencia metodológica no es significativa, ya que 
usar un programa u otro en la resintetización no tendría por qué provocar diferencias 
importantes en los estímulos finales, pues se llegó a los mismos resultados. 
 Para obtener los estímulos bisilábicos, Pamies et al. (2001) grabaron tanto en voz 
femenina como en voz masculina la sílaba /ba/. Después, la duplicaron para que los 
estímulos tuvieran dos sílabas exactamente iguales y al resintetizar los estímulos sólo 
se modificaron las segundas sílabas para obtener las diferencias tonales deseadas. Así, 
en su experimento no se contrastaron dos estímulos, sino las dos sílabas de un mismo 
estímulo. Para seguir con su metodología, esta parte del diseño experimental se siguió 
al pie de la letra para la presente tesis. 
 Aunque en el reporte de Pamies et al. (2001) no está explícito, se infiere que el 
experimento se aplicó a un grupo de informantes al mismo tiempo y no se menciona si 
esto fue con audífonos o no. Asimismo, los informantes registraron sus respuestas en 
hojas marcando “iguales” si consideraban que los estímulos eran iguales o “diferentes” 
en el caso de que percibieran diferencias entre ellos. La aplicación de los experimentos 
de esta investigación se realizó siguiendo la misma metodología que en la fase de los 
contextos lingüísticos, es decir, con audífonos, de forma individual y con el programa 
Praat (Boersma & Weenink, 2015). 
 La escala del experimento de Pamies et al. (2001) fue de -2 st a 2 st con 
variaciones de medio semitono entre los estímulos (-2 st, -1.5 st, -1st, -0.5 st, etc.) y los 
estímulos isotonales donde la diferencia fue de 0 st se repitieron seis veces (tres para 
voz masculina y tres para voz femenina). Por lo tanto, tuvieron 22 estímulos: once en 
voz masculina y once en voz femenina. El experimento de este trabajo varía 
35 
 
parcialmente en ese aspecto. Con el fin de tener más repeticiones de los estímulos se 
usó la escala de -2 st a 2 st y las variaciones tonales de éstos se explican en la tabla 2.6. 
 
 
Estímulo Diferencias en st respecto a la primera sílaba 
7 +2 st 
6 +1.5 st 
5 +1 st 
4 (base) 0 st 
3 -1 st 
2 -1.5 st 
1 -2 st 
 Tabla 2.6. Distribución de los estímulos para el experimento bisilábico. 
 
 Cada estímulo se repite quince veces en el experimento, y tomando en cuenta que 
son dos géneros, se obtuvo un total de 210 ítems para el experimento. Esta vez, los 
periodos de descanso dentro de cada experimento se dieron cada 40 ítems. La razón 
por la cual no se siguió la escala propuesta por el experimento original es porque 
resulta más certero analizar los datos y establecer un umbral cuando la cantidad de 
repeticiones de los diferentes estímulos es igual. 
 Al igual que en el resto de los experimentos, para esta prueba hubo un 
experimento con estímulos de nivel y otro con estímulos de contorno, los dos con la 
misma distribución de estímulos y sus diferencias tonales. 
 
Estos experimentos, aunque se pensaron como los definitivos, sólo se aplicaron a cinco 
informantes con la intención de revisar sus resultados y posteriormente aplicarlos a los 
quince restantes. Sin embargo, tras revisarlos se encontró que, aunque sí reconocían las 
diferenciastonales, este reconocimiento era menor al 50%. Asimismo, cuando se pidió la 
opinión de los informantes, comentaron que les pareció muy difícil y tedioso escuchar los 
mismos estímulos uno tras otro, ya que eran demasiados para mantener la concentración y 
su desempeño bajaba durante la aplicación de las pruebas. Por ello, se decidió que era 
necesario una última modificación para aplicar los experimentos y que la tarea se cumpliera 
satisfactoriamente. 
 
36 
 
2.2. EXPERIMENTOS DEFINITIVOS 
Tras discutir los problemas de la tercera prueba piloto se decidió que, para no alterar por 
completo los experimentos y resolver el problema planteado, la solución más conveniente 
era aplicar un solo experimento donde se presentaran los tres contextos lingüísticos y otro 
experimento para el de estímulos bisilábicos. De esta forma el experimento presentaría de 
forma aleatoria los estímulos fonemáticos, los silábicos y los frásticos y los informantes 
mantendrían la concentración durante toda la prueba. Se llegó a la conclusión de no incluir 
en el mismo experimento a los estímulos bisilábicos porque, aunque los experimentos son 
muy similares, las tareas no son exactamente las mismas y mezclarlos podría causar 
confusión entre los informantes. Así, se obtuvieron cuatro experimentos: el de contextos 
lingüísticos con estímulos de nivel, el de estímulos bisilábicos con estímulos de nivel, el de 
contextos lingüísticos con estímulos de contorno y el de estímulos bisilábicos con estímulos 
de contorno. Enseguida se explican estos experimentos. 
 
2.2.1. Fase de contextos lingüísticos 
Al juntar los tres experimentos, se obtuvieron 624 ítems, por los que se cambiaron los 
periodos de descanso para que ahora se presentaran cada 50 estímulos. Como se mencionó, 
estas pausas no tienen un tiempo establecido, por lo que los informantes son libres de 
descansar lo que consideren necesario para realizar el experimento completo en sus mejores 
condiciones. Sin embargo, aplicaron los experimentos en dos sesiones para dividir las horas 
de trabajo. De esa forma, se aplicaron dos experimentos en la primera sesión y los dos 
restantes en la segunda sesión. El orden de aplicación, como en la tercera prueba piloto, 
también fue aleatorio para cada informante. 
 Los estímulos que se usaron para la prueba de nivel y para la de contorno fueron 
exactamente iguales, pero como la distribución de estos cambió, es conveniente detallar 
estos cambios. En el anexo 1 se presenta el script del experimento. El script que se usó 
como plantilla se obtuvo del taller Laboratory Approaches to Romance Phonology 6, 
impartido por Miquel Simonet en El Colegio de México del 3 al 5 de octubre del 2012. 
Posteriormente, se hicieron las modificaciones necesarias para adaptarlo a las necesidades 
del experimento. Con el fin de explicarlo, se agregaron incisos en negritas a las líneas del 
script que se comentarán a continuación. 
37 
 
(A). Especifica que los estímulos son sonidos. 
(B). El primer texto entre comillas corresponde a la carpeta en la que se encuentras los 
archivos que se usaron en el experimento. En este caso, corresponde a la carpeta de 
estímulos de nivel. El segundo texto entre comillas especifica el tipo de archivo con la 
extensión .wav. 
(C). En esta línea se estable el tiempo que debe transcurrir para que se presenten los 
estímulos, el cual es de 0.5 s. 
(D). Indica el tiempo de espera entre el primer y el segundo estímulo a contrastar, que 
es de 0.5 s. 
(E). En esta línea se señala que el experimento está compuesto por 624 estímulos y, 
posteriormente, se presentan éstos. Como se observa, sólo se muestran los nombres de 
los estímulos y están en clave. La primer cifra de la clave es numérica y corresponde al 
número de estímulos, la segunda cifra es alfabética y corresponde al género (H para 
masculino y M para femenino) y la tercera también es alfabética y corresponde al 
contexto lingüístico (E para /e/, G para /ɡe/ y L para La luna). De esta forma, “5HE, 
1HE” corresponde a la comparación del quinto estímulo de /e/ en voz masculina con el 
primer estímulo de /e/ en voz masculina. 
(F). Esta línea indica el número de repeticiones de cada estímulo. Como cuando se 
presentaron los estímulos, en (E), se introdujeron las repeticiones necesarias, en esta 
línea se especificó que no habría más repeticiones. Esto se hizo porque, como se 
explica en la tabla 5, algunos estímulos tienen más apariciones que otros para que 
hubiera la misma cantidad de diferencias tonales, por lo cual no se podía poner el 
mismo número de repeticiones para todos dentro del script y se tuvieron que 
especificar los 624 ítems. 
(G). Aquí se establecen los periodos de descanso, que se programaron para que 
aparecieran cada 50 estímulos. 
(H). Con esa instrucción se elimina la posibilidad de que dos estímulos iguales 
aparezcan de forma consecutiva, aunque automáticamente los estímulos se presenten 
de forma aleatoria. 
(I). Esta línea corresponde a la instrucción que se presenta al inicio del experimento. 
38 
 
(J). La instrucción que se muestra aparece todo el tiempo en la parte superior central de 
la pantalla de Praat (Boersma & Weenink, 2015) mientras se responde el experimento. 
Esto se muestra en la figura 2.1. 
 
Figura 2.1. Toma de pantalla donde se muestra la aplicación del experimento de contextos 
lingüísticos. 
 
(K). Esta instrucción se muestra en los periodos de descanso para indicar al informante 
que no tiene un tiempo restringido. 
(L). Esta línea muestra la leyenda que se muestra al final del experimento. 
(M). Con esa instrucción se elimina la posibilidad de que el informante repita el 
estímulo. 
(N). Ya que no existe la opción de un botón de repetición, es esta línea no se agrega 
dicho botón. 
(O). Como no se puede decir que lo que percibe un informante es un acierto o un error, 
no se agregó en el experimento la retroalimentación de “correcto” o “incorrecto” en 
cada respuesta, por lo que en estas dos líneas no se agregan dichos botones. 
(P). Aquí se indica que las respuestas no son audios. 
(Q). En estas líneas se indica que hay dos respuestas posibles: iguales y diferentes, que 
corresponden a la tecla “z” y “m” respectivamente. 
39 
 
(R). Como se mencionó, no hay respuestas correctas o incorrectas, por lo que esta línea 
se dejó vacía. 
Aunque el script corresponde al experimento de estímulos de nivel, el de estímulos de 
contorno tiene exactamente la misma estructura, sólo que la carpeta en donde busca los 
estímulos contiene los de contorno. 
 
2.2.2. Fase de estímulos bisilábicos 
Como esta prueba fue más breve que la de contextos lingüísticos, se decidió que no se 
modificaría nada. Además, se intentó que fuera lo más similar posible a la de Pamies et al. 
(2001), por lo que se dejó exactamente igual a la que se explicó en la tercera prueba piloto. 
No obstante, al igual que para la fase de contextos lingüísticos, en el anexo 2 se muestra el 
script que se usó para el experimento y cuya plantilla fue la misma. Enseguida se explican 
los incisos que se añadieron. Como se puede ver, sólo se explican las líneas que no son 
iguales a las del primer script. 
 
(A). Dado que para este experimento los estímulos se repitieron las mismas veces, sólo 
se presentaron los catorce estímulos base; los siete con voz femenina y los siete con 
voz masculina. Como se explicó, en este experimento no se contrastan dos estímulos, 
sino que la distinción se da dentro de las dos sílabas de cada estímulo presentado, por 
lo que la explicación de las claves es la siguiente: la primera cifra, que es numérica, 
corresponde al número del estímulo y la segunda cifra, alfabética, corresponde al 
género. Así, “1H” representa el primer estímulo de voz masculina. 
(B). En esta línea se indica que cada estímulo debe repetirse 15 veces, para obtener un 
total de 210 ítems. 
(C). Ya que este experimento es más breve que el de contextos

Otros materiales