Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE FILOSOFÍA Y LETRAS COLEGIO DE LETRAS HISPÁNICAS ANÁLISIS EXPERIMENTAL DEL UMBRAL DE PERCEPCIÓN ENTONATIVA EN EL ESPAÑOL DEL CENTRO DE MÉXICO TESIS QUE PARA OBTENER EL TÍTULO DE: LICENCIADA EN LENGUA Y LITERATURAS HISPÁNICAS P RESENTA: LAURA MURRIETA BELLO ASESOR: DR. PEDRO MARTÍN BUTRAGUEÑO CIUDAD DE MÉXICO, 2016 UNAM – Dirección General de Bibliotecas Tesis Digitales Restricciones de uso DERECHOS RESERVADOS © PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL Todo el material contenido en esta tesis esta protegido por la Ley Federal del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). El uso de imágenes, fragmentos de videos, y demás material que sea objeto de protección de los derechos de autor, será exclusivamente para fines educativos e informativos y deberá citar la fuente donde la obtuvo mencionando el autor o autores. Cualquier uso distinto como el lucro, reproducción, edición o modificación, será perseguido y sancionado por el respectivo titular de los Derechos de Autor. A mi madre y hermano, como todo. AGRADECIMIENTOS Agradezco a la Universidad Nacional Autónoma de México donde me he formado académicamente. También al Consejo de Ciencia y Tecnología (Conacyt) y a El Colegio de México por el financiamiento para el desarrollo de este proyecto de tesis. A mis informantes, quienes me regalaron su tiempo para realizar los experimentos. Fue una tarea a la que no estaban acostumbrados y la desempeñaron con completa colaboración y amabilidad. A mis lectores, gracias por sus comentarios y correcciones que me ayudaron a que esta tesis mejorara y a que yo aprendiera. A mi asesor, el Dr. Pedro Martín Butragueño, a quien admiro y aprecio. Gracias por ayudarme a crecer como lingüista y como persona. Su guía ha sido una de las experiencias más enriquecedoras de mi vida. A los integrantes del Seminario de Prosodia, especialmente a Jonathan Caballero, que me ayudaron en el desarrollo de este proyecto. A mi familia por su apoyo, formación y cariño pero, sobre todo, por su paciencia. También agradezco a mis amigos por las experiencias que hemos compartido. 1 ÍNDICE GENERAL INTRODUCCIÓN…………………………………………………………………………… 7 CAPÍTULO 1: MARCO TEÓRICO…………………………………………………………… 11 CAPÍTULO 2: METODOLOGÍA……………………………………………………………... 23 2.1. Pruebas preliminares…………………………………………………………. 23 2.1.1. Primera prueba piloto………………………………………………… 24 2.1.2. Segunda prueba piloto………………………………………………... 28 2.1.3. Tercera prueba piloto…………………………………………………. 31 2.2. Experimentos definitivos……………………………………………………… 36 2.2.1. Fase de contextos lingüísticos………………………………………... 36 2.2.2. Fase de estímulos bisilábicos………………………………………… 39 2.3. Diseño y edición de los estímulos…………………………………………….. 40 2.4. Aplicación de los experimentos………………………………………………. 43 2.4.1. Muestreo……………………………………………………………… 44 CAPÍTULO 3: ANÁLISIS DE RESULTADOS………………………………………………….. 47 3.1. Método de análisis……………………………………………………………. 47 3.2. Análisis de resultados………………………………………………………… 51 3.2.1. Resultados según el contexto lingüístico……………………………... 51 3.2.2. Resultados del experimento ba.ba……………………………………. 82 3.2.3. Resultados según la oposición nivel/contorno……………………….. 90 3.3. Conclusiones parciales……………………………………………………….. 92 CAPÍTULO 4: DISCUSIÓN Y CONCLUSIONES……………………………………………….. 95 REFERENCIAS BIBLIOGRÁFICAS………………………………………………………....... 103 ANEXOS Anexo 1. Script del experimento de contextos lingüísticos………………………... 107 Anexo 2. Script del experimento de estímulos bisilábicos………………………… 109 Anexo 3. Resultados de los experimentos de contorno con los casos de igualdad... 111 Anexo 4. Resultados de los experimentos de contorno sin los casos de igualdad.... 115 2 3 ÍNDICE DE TABLAS Tabla 2.1. Distribución de los estímulos de la prueba de nivel. Primera prueba piloto………… 27 Tabla 2.2. Distribución de los estímulos de la prueba de contorno. Primera prueba piloto…….. 27 Tabla 2.3. Distribución de los estímulos de la prueba de nivel. Segunda prueba piloto……… 30 Tabla 2.4. Distribución de los estímulos de la prueba de contorno. Segunda prueba piloto….. 30 Tabla 2.5. Distribución de los estímulos para las pruebas de contextos lingüísticos…………. 32 Tabla 2.6. Distribución de los estímulos para el experimento bisilábico……………………... 35 Tabla 3.1. Casos en que se reconocieron los estímulos como diferentes en el contexto fonemático…………………………………………………………………………. 52 Tabla 3.2. Frecuencias acumuladas. Contexto fonemático. Informante 1…………………….. 54 Tabla 3.3. Cuartiles con sus respectivas medianas y medias. Contexto fonemático. Informante 1……………………………………………………………………….. 54 Tabla 3.4. Casos en que se reconocieron los estímulos como diferentes. Contexto fonemático. Informante 1………………………………………………………….. 57 Tabla 3.5. Frecuencias acumuladas. Contexto fonemático. Informante 1……………………. 58 Tabla 3.6. Cuartiles con sus respectivas medianas y medias. Contexto fonemático. Informante 1……………………………………………………………………….. 58 Tabla 3.7. Resultados generales para el contexto fonemático………………………………… 60 Tabla 3.8. Resultados generales para el contexto fonemático donde no se contabilizaron los casos de igualdad…………………………………………………………………... 62 Tabla 3.9. Casos en que se reconocieron los estímulos como diferentes. Contexto silábico. Informante 1……………………………………………………………………….. 64 Tabla 3.10. Frecuencias acumuladas. Contexto silábico. Informante 1………………………... 65 Tabla 3.11. Cuartiles con sus respectivas medianas y medias. Contexto silábico. Informante 1. 66 Tabla 3.12. Casos en que se reconocieron los estímulos como diferentes. Contexto silábico. Informante 1……………………………………………………………………….. 67 Tabla 3.13. Frecuencias acumuladas. Contexto silábico. Informante 1………………………... 68 Tabla 3.14. Cuartiles con sus respectivas medianas y medias. Contexto silábico. Informante 1. 69 Tabla 3.15. Resultados generales para el contexto silábico……………………………………. 71 Tabla 3.16. Resultados generales para el contexto silábico donde no se contabilizaron los casos de igualdad…………………………………………………………………... 72 Tabla 3.17. Casos en que se reconocieron los estímulos como diferentes. Contexto frástico. Informante 1……………………………………………………………………….. 73 4 Tabla 3.18. Frecuencias acumuladas. Contexto frástico. Informante 1………………………… 75 Tabla 3.19. Cuartiles con sus respectivas medianas y medias. Contexto frástico. Informante 1. 75 Tabla 3.20. Casos en que se reconocieron los estímulos como diferentes. Contexto frástico. Informante 1……………………………………………………………………….. 76 Tabla 3.21. Frecuencias acumuladas. Contexto frástico. Informante 1………………………… 78 Tabla 3.22. Cuartiles con sus respectivas medianas y medias…………………………………. 78 Tabla 3.23. Resultados generales para el contexto frástico…………………………………….. 80 Tabla 3.24. Resultados generales para el contexto frástico donde no se contabilizaron los casos de igualdad…………………………………………………………………... 81 Tabla 3.25. Casos en que se reconocieron los estímulos como diferentes. Informante 1……… 83 Tabla 3.26. Frecuencias acumuladas. Informante 1……………………………………………. 84 Tabla 3.27. Cuartiles con sus respectivas medianas y medias. Informante 1…………………... 84 Tabla 3.28. Casos en que se reconocieron los estímulos como diferentes. Informante 1……… 85 Tabla 3.29. Frecuencias acumuladas. Informante 1. Los datos excluyen los casos de igualdad. 86 Tabla 3.30. Cuartiles con sus respectivas medianas y medias. Informante 1. Los datos excluyen los casos de igualdad……………………………………………………. 87 Tabla 3.31. Resultados generals del experimento ba.ba……………………………………….. 88 Tabla 3.32. Resultados generalesdel experimento ba.ba donde no se contabilizaronlos casos de igualdad………………………………………………………………………… 89 Tabla 3.33. Puntos de inflexión en el experimento de contorno……………………………….. 91 Tabla 4.1. Tabla de resumen con los umbrales para cada contexto lingüístico y para el experimento de estímulos bisilábicos……………………………………………… 95 5 ÍNDICE DE FIGURAS Figura 1.1. Función linealy función logarítmica……………………………………………….. 15 Figura 1.2. Curvas melódicas en Hz y st………………………………………………………. 16 Figura 2.1. Toma de pantalla donde se muestra la aplicación del experimento de contexto lingüísticos………………………………………………………………………… 38 Figura 2.2. Toma de pantalla donde se muestra la aplicación del experimento bisilábico……. 40 Figura 2.3. Toma de pantalla donde la curva melódica en el proceso de regularización……… 41 Figura 2.4. Toma de pantalla donde la curva melódica de un estímulo de contorno después de ser editada…………………………………………………………………………. 42 Figura 3.1. Representación gráfica de la ecuación lineal y la R de Pearson para los datos del informante 1 del contexto fonemático…………………………………………….. 53 Figura 3.2. Dispersión de las frecuencias acumuladas con sus respectivas R de Pearson y ecuaciones lineales. Contexto fonemático. Informante 1…………………………. 55 Figura 3.3. Representación gráfica con su respectiva R de Pearson para los datos del informante 1 del contexto fonemático……………………………………………... 57 Figura 3.4. Dispersión de las frecuencias acumuladas con sus respectivas R de Pearson. Contexto fonemático. Informante 1………………………………………………... 59 Figura 3.5. Representación gráfica de la R de Pearson y su regresión lineal para los datos del informante 1 del contexto silábico………………………………………………… 65 Figura 3.6. Representación gráfica de las frecuencias acumuladas. Contexto silábico. Informante 1. Donde la curva oscura pertenece a los datos del total de los casos y la curva clara pertenece a los datos de los casos marcados como diferentes……… 66 Figura 3.7. Representación gráfica de la R de Pearson para los datos del informante 1 del contexto silábico…………………………………………………………………… 68 Figura 3.8. Representación gráfica de la curva sigmoidal de las frecuencias acumuladas. Contexto silábico. Informante 1…………………………………………………… 69 Figura 3.9. Representación gráfica de la R de Pearson para los datos del informante 1 del contexto frástico…………………………………………………………………… 74 Figura 3.10. Representación gráfica de la curva sigmoidal de las frecuencias acumuladas. Contexto frástico. Informante 1……………………………………………………. 75 Figura 3.11. Representación gráfica de la R de Pearson para los datos del informante 1 del contexto frástico…………………………………………………………………… 77 6 Figura 3.12. Representación gráfica de la curva sigmoidal de las frecuencias acumuladas. Contexto frástico. Informante 1……………………………………………………. 79 Figura 3.13. Representación gráfica de la R de Pearson para los datos del informante 1………. 83 Figura 3.14. Representación gráfica de la curva sigmoidal de las frecuencias acumuladas. Informante 1……………………………………………………………………….. 85 Figura 3.15. Representación gráfica de la R de Pearson para los datos del informante 1. Los datos excluyen los casos de igualdad……………………………………………… 86 Figura 3.16. Representación gráfica de la curva sigmoidal de las frecuencias acumuladas. Informante 1. Donde la curva oscura pertenece a los datos del total de los casos y la curva clara pertenece a los datos de los casos marcados como diferentes. Los datos excluyen los casos de igualdad.……………………………………………... 87 7 INTRODUCCIÓN La percepción consiste en la interpretación que nuestro cerebro hace de los estímulos que recibe. Esta interpretación está sujeta tanto a influencias internas como externas, por lo que fue difícil encontrar una aproximación adecuada en los primeros estudios sobre este fenómeno. En el caso concreto de la percepción de elementos lingüísticos, intervienen tanto la capacidad auditiva de cada individuo, como los diferentes sistemas lingüísticos que afectan su interpretación. Durante muchos años parecía imposible que esta área pudiera estudiarse con rigor científico. No obstante, a principios del siglo XIX y gracias a los estudios de Ernst Heinrich Weber y Gustav Theodor Fechner surgió la psicofísica (Johnson, Hsiao & Yoshioka, 2002); el objeto de estudio de esta ciencia es la relación entre los estímulos sensoriales y su percepción. Ahora sabemos que existe una relación directamente proporcional entre ambas dimensiones, relación de la cual se hablará en el capítulo 1 de esta tesis. Con base en el trabajo de Weber y Fechner, se ha estudiado de forma objetiva la percepción y, aunque se siguen debatiendo varias cuestiones relacionadas con el tema, es posible analizar de forma concreta cómo percibimos los estímulos lingüísticos, entre muchas otras cuestiones. En el análisis de las curvas melódicas se toma como medida fija 1.5 semitonos para decir que una diferencia en la F0 es significativa. Esto se estableció bajo el supuesto de que 1.5 semitonos es la cantidad mínima perceptible por los hablantes. No obstante, se sabe que la percepción de los estímulos sonoros puede verse afectada por cuestiones ajenas a la capacidad auditiva de cada individuo. Se supone que un músico, por ejemplo, es capaz de percibir diferencias tonales de un cuarto de tono. Bajo esta premisa, es posible que las diferencias en los sistemas lingüísticos también influyan en la percepción. Incluso el contexto lingüístico puede afectar la forma en que interpretamos las diferencias tonales de la F0. Por ello es importante que se hagan trabajos experimentales para saber los posibles comportamientos perceptuales según las diferentes lenguas. Después de ver este tema en el curso de Fonética forense de Letras Hispánicas y discutirlo con mi asesor, surgió la idea de realizar un experimento para comprobar si 1.5 semitonos son suficientes para percibir las diferencias tonales de la F0. Asimismo, tuvimos la duda de si la percepción se vería influida por el contexto lingüístico, por lo que 8 decidimos agregar experimentos con el fin de observar las diferencias perceptuales entre los contextos fonemáticos, silábicos y frásticos. Para poder analizar esto, es necesario un enfoque experimental, ya que es imposible observar la percepción de forma certera si uno se restringe a un estudio descriptivo. El método empírico, que se basa en la experimentación, permite aislar el fenómeno y revelar cuestiones que difícilmente podrían apreciarse de otra forma. En prosodia, por ejemplo, se puede aislar la F0 de la intensidad y duración y estudiarla sin otros factores que influyan en su percepción. De ese modo, lo que se observe a través de un experimento se puede atribuir a la F0 y no queda la incertidumbre de que la intensidad y la duración influyan en lo observado. Asimismo, este tipo de análisis da pie a que surjan fenómenos que no se habían observado con anterioridad. En el capítulo 1 de esta tesis se presenta un marco teórico con dos líneas principales. Por un lado, se muestra lo que se ha hecho dentro del área de la percepción en prosodia, así como algunas discusiones relacionadas con el tema. Y, por otro lado, se presenta un breve panorama de cómo la psicofísica y la música han estudiado la percepción de estímulos auditivos. En el capítulo 2, que corresponde al apartado de metodología, se explica en detalle todo el proceso del diseño experimental y de su aplicación. Se menciona también el proceso de piloteo que se hizo para llegar a los experimentos finales, ya que varios aspectos se corrigieron gracias a las pruebas preliminares. El capítulo 3 inicia con una breve explicación del método de análisis, de modo que se definen algunos conceptos básicos de estadística que se usaron en el trabajo y se justifica el tamaño de la muestra. Después,se presentan los resultados de los experimentos y su análisis. Finalmente, la discusión de los resultados se encuentra en el capítulo 4. 9 OBJETIVOS El principal objetivo de esta tesis es analizar de qué manera se comporta el posible umbral de percepción de las diferencias en la frecuencia fundamental (F0). Esto no se limita a establecer un valor para dicho umbral, sino que también se presenta un análisis experimental que contempla tres contextos lingüísticos −fonemático, silábico y frástico− para estudiar las posibles diferencias perceptuales entre estos contextos. Asimismo, interesa un contraste con los trabajos previos, por lo que se usará el experimento de Pamies et al. (2001) como base para uno de los experimentos de la tesis. HIPÓTESIS Trabajos previos, que se abordarán dentro del marco teórico, proponen que el umbral de percepción de las diferencias tonales se ubica alrededor de 1.5 semitonos. La principal hipótesis es que, en términos generales, el umbral estará cerca de dicho valor, pero que habrá diferencias entre los diferentes contextos de información lingüística en que se ven involucrados los estímulos lingüísticos. JUSTIFICACIÓN En los estudios prosódicos, la frecuencia fundamental, o F0, es el elemento más analizado, ya que transmite la mayoría de la información prosódica. Gracias a los avances tecnológicos y a su fácil acceso, este campo de investigación se ha desarrollado exponencialmente en los últimos años. No obstante, la forma en que deben medirse las variaciones de la curva melódica es un tema de discusión recurrente. Uno de los problemas es que, aunque la curva es un continuo, está formada por elevaciones y descensos tonales de diferentes magnitudes, que hay que medir. Una de las propuestas es que se use una magnitud relativa para medir los movimientos tonales anteriores, aunque el método que se ha usado en los estudios recientes es el de establecer un valor fijo para identificar las diferencias significativas. Para lograr una uniformidad metodológica, se estableció 1.5 semitonos para decir que un cambio en la F0 es significativo. No obstante, es necesario que estudios perceptuales verifiquen que efectivamente 1.5 semitonos es lo que se percibe. Y aunque se ha hecho este tipo de trabajos en otras lenguas y otras variedades del español, los cuales se expondrán en 10 el capítulo 1, no hay uno para el español del centro de México, por lo que es pertinente realizarlo y contrastar los resultados con los de trabajos previos. Asimismo, hay varios elementos que influyen en la percepción de la frecuencia fundamental. Entro ellos se encuentra el contexto lingüístico. Es posible que la percepción de la F0 de una sílaba sea diferente a la de una frase o un fonema. En esta tesis se tomó en cuenta dicha posibilidad y los experimentos fueron diseñados con el fin de analizar la influencia de tres contextos: fonemático, silábico y frástico. 11 CAPÍTULO 1 MARCO TEÓRICO Ya que la percepción es un fenómeno que se ha estudiado desde diferentes disciplinas, en este capítutulo se expondrá lo que se ha hecho en lingüística, psicología y música en materia de percepción auditiva. También se abordarán algunos conceptos relacionados con la percepción de estímulos lingüísticos como la diferencia entre las escalas lineales, logarítmicas y psicoacústicas y sus implicaciones en los estudios prosódicos. Gracias a los avances tecnológicos y a su relación con diferentes áreas de la lingüística, el estudio de la entonación se ha desarrollado exponencialmente. Uno de los campos de estudio más productivos en los últimos años es la relación entre prosodia, sintaxis y discurso (Martín Butragueño, 2006). Es cada vez más frecuente que los trabajos sintácticos incluyan en su estudio una base prosódica en la que se observa el comportamiento de los fenómenos suprasegmentales en diferentes contextos lingüísticos. Gracias a los estudios prosódicos sabemos, por ejemplo, que los movimientos de la curva melódica son un elemento fundamental para distinguir entre una oración aseverativa como Ya está lista la cena y su par mínimo interrogativo ¿Ya está lista la cena? (Martín Butragueño, 2014). De igual forma, en sociolingüística, los estudios prosódicos tienen un fuerte impacto y han ayudado a que esta área crezca con rapidez. Gracias a ellos sabemos, entre otras cosas, que en la Ciudad de México hay un proceso de integración dialectal, el cual se ve reflejado en la disminución de las prominencias tonales de las sílabas nucleares (Martín Butragueño, en preparación). Al mismo tiempo que los estudios prosódicos han aumentado, se siguen trabajando varios temas relacionados con el área. Martínez Celdrán y Fernández Planas (2007) distinguen tres niveles dentro del estudio prosódico. El primer nivel es el físico, que corresponde a parámetros prosódicos como el tono, la duración y la intensidad. El segundo nivel es la interpretación fonética de los valores físicos y es conocido como la melodía. Por último, el tercer nivel es la interpretación fonológica de la melodía: la entonación. El tono es un fenómeno suprasegmental que se manifiesta mediante la variación de la frecuencia fundamental dentro de una sílaba (Llisterri, 2015) y la curva melódica es la 12 representación acústica, expresada mediante la F0, de la entonación (Cantero, 1999). Es por ello que para estudiar la entonación es necesario analizar correctamente la curva melódica. Y, aunque ésta es un continuo, está formada por variaciones de la F0. Estas variaciones deben medirse, pero para esto hay que establecer un parámetro de dicha medición. Es ahí donde surge la discusión sobre qué método es mejor para medir las diferencias tonales y cómo funciona la percepción de dichas diferencias. Existen dos propuestas principales para medir las diferencias tonales de la F0 (Cantero, 1999). La primera consiste en una relativización de cada valor tonal con respecto al valor anterior, mientras que la segunda pretende establecer un valor fijo, el cual debería coincidir con el umbral de percepción de las diferencias tonales. Ambas propuestas presentan dificultades. La primera parece sencilla en tanto que no haría falta preguntarse si las diferencias que se consideran significativas serían o no percibidas por un hablante, aunque por esto mismo sería un análisis cuestionable. Además, esa relativización de los valores dentro de la curva melódica podría generar diferencias entre los análisis, ya que dificultaría la comparación entre resultados de diferentes trabajos –pues cada uno usaría un valor diferente para medir las F0 de sus datos– y complicaría las réplicas en el aspecto metodológico. Por otro lado, la segunda propuesta obliga a una serie de estudios experimentales para establecer dicho umbral de percepción. Y, bajo el supuesto de que la percepción tonal no es la misma para los hablantes de lenguas tonales y no tonales –y que incluso podría variar entre cada lengua–, es necesario hacer estudios perceptuales sobre la entonación en hablantes de diferentes lenguas. En muchos estudios prosódicos, actualmente se usa un valor de referencia para medir las variaciones en la curva melódica. Normalmente se usa 1.5 semitonos para establecer que las diferencias tonales estudiadas son significativas. No obstante, este valor debe basarse en la percepción de los hablantes de la lengua en cuestión. Un análisis descriptivo difícilmente comprobará que tal valor es realmente significativo para el hablante, ya que sólo permite analizar la producción lingüística. El fenómeno de percepción difícilmente se verá reflejado en un estudio únicamente descriptivo, ya que la producción no corresponde completamente a la percepción. Existen algunos trabajos de corte experimental que han estudiado la percepción de este fenómeno. No obstante, las diferencias entre los resultadosde los experimentos han 13 impedido que se defina un umbral de percepción tonal definitivo. Mientras que unas propuestas señalan que el umbral oscila entre 0.5 y 2 semitonos, otros afirman que se necesitan 9 semitonos para que una variación en la F0 se perciba (Bechem, 1937). Las diferencias tan pronunciadas entre los resultados pueden deberse a que se analizaron en lenguas diferentes o, bien, a las variaciones metodológicas entre los diseños experimentales de cada propuesta. Pamies et al. (2001) encuentran que estas variaciones metodológicas representan un problema y proponen que en futuros estudios se siga un método en común. Y es que factores como el tamaño de la muestra pueden afectar los resultados más de lo que se podría esperar. Del mismo modo, hay otros elementos prosódicos que podrían influir en la percepción tonal. Ladefoged explica que: So far we have been assuming that differences in tone and intonation are realized simply by the pitch. But, from a speaker’s point of view, the phonetic correlate of pitch may be specific adjustments of the laryngeal muscles that control pitch. These laryngeal adjustments could be said to be what the speaker is aiming at when trying to produce a particular tone or intonation contour. As a result, some of variations in pitch that are detected by a perfect pitch tracking system may be irrelevant from a phonological point of view. (Ladefoged, 2003: 23) Son varios los recursos prosódicos que intervienen en el habla: la duración e intensidad de las unidades, los movimientos tonales a lo largo de la F0 y otros aspectos como las pausas y los alargamientos (Martín Butragueño, 2008: 160). Cada uno de estos elementos se estudia de forma objetiva, por lo que se recurre a valores fijos al contrastarlos. De este modo se establecen diferentes niveles de intensidad, duración, etc. El debate reside en que, en la mayoría de los casos, no hay una forma de probar que estos parámetros sean realmente percibidos por los hablantes. Por ello es necesario el trabajo de corte experimental, en el que se establecen umbrales diferenciales en la percepción de estos elementos prosódicos. La psicofísica define un umbral diferencial (ΔE) como una diferencia mínima necesaria para ser reconocida. Asimismo, la percepción es la forma en que el cerebro decodifica los estímulos que recibe. La percepción de los estímulos lingüísticos está condicionada no sólo por la capacidad física de los hablantes, sino también por su lengua. En el contexto fonemático, por ejemplo, es común adaptar fonemas de otras lenguas al 14 sistema propio. Y no es que el cerebro sea incapaz de reconocerlos, sino que la lejanía con otras lenguas influye en la percepción. En prosodia, el umbral de percepción entonativa sería la diferencia mínima de la frecuencia fundamental que fuera reconocida por un miembro de la comunidad lingüística. Por ello es importante realizar este tipo de estudios para el caso específico del español del centro de México y comparar los resultados con los que se han obtenido para otras lenguas y para otras variedades del español. En esta tesis se trabajará el umbral de percepción como el punto de inflexión dentro de la distribución de los datos. Este punto de inflexión dejará por debajo las diferencias que dificilmente se percibieron, y por encima aquellas que se percibieron en su mayoría. Cuando se hable del umbral de percepción de las diferencias tonales, se hará referencia a este punto de inflexión. Estudiar la curva melódica es, por sí misma, una tarea complicada. Incluso la medición de ésta, que sería el primer paso para su análisis, involucra varias discusiones vigentes. Una de ellas es establecer una medida para el umbral de percepción, aunque existe otro debate que ha estado sobre la mesa desde hace algunas décadas: ¿qué escala es mejor para el análisis prosódico? Para poder analizar cuantitativamente la percepción y establecer las escalas más apropiadas es necesario recurrir al trabajo de la psicofísica. Esta disciplina oscila entre el campo de la física y la psicología y su objeto de estudio es la relación que existe entre la magnitud de los estímulos y la percepción de éstos. La psicofísica nace a principios del siglo XIX gracias a los estudios de Ernst Heinrich Weber y Gustav Theodor Fechner (Johnson, Hsiao & Yoshioka, 2002). El debate sobre las escalas puede remitirse a ellos. La ley Weber-Fechner establece que la percepción de un estímulo es proporcional a su magnitud (Johnson, Hsiao & Yoshioka, 2002). En términos acústicos, la ley se puede ejemplificar de la siguiente manera: cuando contrastamos una conversación normal con una conversación en susurro, una diferencia de 3 semitonos es fácilmente percibida. Sin embargo, en un concierto, donde el sonido alcanza una intensidad mayor, la misma variación de 3 semitonos difícilmente se reconoce. Es decir, que mientras el contexto acústico sea más intenso, las variaciones tonales deberán ser mayores para que se perciban, mientras que si el contexto acústico es de menor intensidad, se podrán percibir variaciones 15 más pequeñas. Por ello la ley Weber-Fechner propone que la percepción se comporta de forma logarítmica y que una escala de este tipo es mejor para su estudio que una lineal (Johnson, Hsiao & Yoshioka, 2002). En una escala lineal, los incrementos en las magnitudes a lo largo del eje de las x tienen el mismo tamaño y por eso se forma una línea recta. Por otra parte, los logaritmos se usan para simplificar los datos. El logaritmo de un número sería el exponente al cual hay que elevar la base de dicho número; en base 10, el logaritmo de 1,000 es 3, ya que si se eleva 10 a la tercera potencia (103), da 1,000 (Spiegel, 1995). Para ver la representación geométrica de una función lineal y una logarítmica, se muestra la figura 1.1. Figura 1.1. Función lineal y función logarítmica. La línea negra proyecta una ecuación logarítmica y la línea gris proyecta una ecuación lineal. El uso de funciones logarítmicas sirve también para normalizar una proyección de datos (Spiegel, 1995). En los análisis prosódicos esto resulta útil, ya que la frecuencia fundamental presenta algunas alteraciones que dificultan su estudio y expresarla en una escala logarítmica ayuda a neutralizarlas. Esto se ejemplifica en la figura 1.2, donde se muestra la comparación entre el uso de una escala lineal y otra logarítmica para el enunciado Una vez en el interior, los agentes encontraron a tres de los niños (Llisterri, 2015). 16 Figura 1.2. Curvas melódicas en Hz y st. Corresponden al enunciado Una vez en el interior, los agentes encontraron a tres de los niños, en voz masculina a la izquierda y en voz femenina a la derecha. (Tomado de Llisterri, 2015, en: http://liceu.uab.es/~joaquim/phonetics/fon_prosod/suprasegmentales_ melodia_entonacion.html#melodia_percepcion) La tradición lingüística ha trabajado con escalas logarítmicas expresadas en hertzios (Hz) o en semitonos (st); la mayoría de los trabajos siguen esta tradición. No obstante, los avances tanto en prosodia como en psicofísica han permitido que se propongan otro tipo de escalas: las psicoacústicas. Dik J. Hermes y Joost C. van Gestel (1991), de cuyo experimento se hablará más adelante, encuentran que estas escalas funcionan mejor para estudiar la percepción lingüística. La escala psicoacústica oscila entre la lineal y la logarítmica. Cuando las magnitudes son bajas, se comportan de forma casi lineal, mientras que cuando aumentan se acercan a una proyección logarítmica. Este tipo de escalas ya se están usando en algunos estudios prosódicos, aunque generalmente se mencionan también las equivalencias en hertzios para que el lector no familiarizado con estas escalas tenga una referencia más cercana. Tal es el caso de “On the presence of final lowering in British and American English”(Arvaniti, 2007), donde la autora presenta sus datos en ERBs 17 (Equivalent Rectangular Bandwidth) con las equivalencias en hertzios. En música, por otro lado, se prefiere todavía una escala en semitonos. Rietveld y Gussenhoven (1985) decidieron que, como la frecuencia fundamental es un objeto de estudio muy importante en la prosodia, era necesario esclarecer algunos puntos. Así, diseñaron un experimento con el objetivo de corroborar que las diferencias tonales de 1.5 semitonos fueran perceptibles e identificar qué escala funciona mejor en percepción, si en semitonos o en hertzios. Sus resultados indicaron que una diferencia de 1.5 semitonos es suficiente para su reconocimiento y que la F0 se modela mejor en una escala en semitonos que en una en hertzios. Dik J. Hermes y Joost C. van Gestel (1991), unos años después, realizaron un experimento con el fin de identificar qué escala funciona mejor en el campo de la percepción: una escala lineal, logarítmica o psicoacústica. Su experimento consistió en presentar pares de estímulos resintetizados del enunciado /mamáma/. Cada estímulo proviene de la misma grabación, la cual se resintetizó para obtener diferentes F0 y conservar la duración e intensidad. La tarea consistió en que el informante debía igualar la F0 del par de estímulos. Las diferencias se presentaron en diferentes escalas: una en semitonos, otra en hertzios y la tercera en ERBs. Aunque los mismos informantes expresaron que la tarea era muy complicada, las pruebas se realizaron con éxito. Los resultados del experimento apuntaron a que la escala con mejores resultados fue la de ERBs, la psicoacústica. Cuando se les dijo esto a los informantes, se sorprendieron, pues esperaban que los estímulos presentados en la escala de semitonos tuvieran un mejor resultado, ya que estaban acostumbrados a ella por su trayectoria en música. Los autores atribuyeron esto a que es diferente la percepción de estímulos musicales y estímulos lingüísticos, lo que es otro argumento a favor de usar una escala psicoacústica en el campo de la percepción. Hasta hace unas décadas, se había llegado a la conclusión de que una escala logarítmica era la mejor opción para perfilar la curva melódica. Sin embargo, trabajos como el de Hermes y van Gestel (1991) han llevado a algunos investigadores a preferir el uso de escalas psicoacústicas como la expresada en ERBs. No obstante, por uniformidad en los estudios y por tradición, se siguen usando las escalas logarítmicas en semitonos, con mayor frecuencia, y en hertzios, con menor frecuencia. 18 Sin embargo, la discusión que más interesa para los objetivos de esta tesis es la del umbral de percepción. Varios son los trabajos que se han hecho para identificar cuál es la diferencia tonal mínima necesaria para que un hablante la reconozca. Aunque en los análisis descriptivos de la curva melódica se está tomando como valor fijo los 1.5 semitonos, se siguen haciendo trabajos experimentales para corroborar que éste corresponda con el umbral de percepción. Los dos experimentos que se mencionaron anteriormente se realizaron con hablantes de holandés. Para el español peninsular, Pamies Beltrán, Fernández Planas, Martínez Celdrán, Ortega Escandell y Amorós Céspedes (2001) hicieron un experimento para ubicar la cantidad mínima necesaria para percibir las diferencias tonales de la curva melódica. Explican que en trabajos anteriores ya se había buscado este umbral, pero que las metodologías diferían entre sí y los resultados eran variados. Algunos autores encontraron que el umbral estaba entre 0.5 y 2 Hz, mientras que otros reportaron que los informantes necesitaron una diferencia mayor a 7 semitonos para reconocerla con seguridad. Con el fin de unificar algunos criterios metodológicos y de estudiar el fenómeno en el español, Pamies et al. (2001) diseñaron otro experimento. Decidieron usar estímulos bisílabos del tipo /ba.ba/, en el cual resintetizaron la segunda sílaba, modificando únicamente la F0 para aislar la variable de otros factores que pudieran influir en el reconocimiento de las diferencias, como la intensidad o la duración. Antes de aplicar el experimento a su grupo de informantes, decidieron pilotearlo con músicos para asegurarse de que funcionara como fue planeado. Al ver que los músicos realizaron con éxito la tarea, llegaron a la conclusión de que ésta era viable. Como la prueba era corta, eligieron un grupo de 100 informantes compuesto por estudiantes de lingüística. En su artículo (Pamies et al., 2001) no se indica si se aplicó el experimento informante por informante o si usaron audífonos. Sólo explican que la instrucción fue que indicaran en una hoja de papel si las sílabas del estímulo eran iguales o diferentes. Tras analizar los resultados observaron que las diferencias por debajo de 1 semitono difícilmente se reconocieron y las mayores a 2 semitonos tuvieron un reconocimiento lo suficientemente alto como para concluir que el umbral se encontraba entre 1 y 2 semitonos. 19 En sus conclusiones explicaron que lo más conveniente era considerar dos tipos de umbrales: el funcional y el perceptivo. La diferencia que proponen radica en que el umbral funcional representa la capacidad auditiva. Según sus resultados, este umbral sería de 1 semitono. Sin embargo, retoman los resultados de Rossi (1999), donde se encuentra que para el francés se necesita una diferencia mayor al 15% (respecto al movimiento anterior de la curva melódica) para percibir las variaciones tonales. Así explican el umbral perceptivo, el cual depende del sistema lingüístico más que de la capacidad auditiva. Con los resultados de Rossi (1999) se infiere ese valor relativo del 15% corresponde al comportamiento prosódico del francés, y, dado que otras lenguas tendrán un comportamiento diferente, no se puede aplicar tal valor para otros sistemas lingüísticos. No obstante, tomar valores relativos llevaría a complicaciones metodológicas cuando se quisiera hacer un estudio comparativo entre diferentes lenguas. Por ello, Pamies et al. (2001) sitúan el umbral perceptivo en un rango entre 1 y 2 semitonos y, para fines prácticos, coinciden con que se puede seguir usando 1.5 semitonos como valor fijo, ya que está entre los dos extremos del umbral perceptivo. Además, explican que un hablante difícilmente tendrá el mismo rendimiento auditivo, ya que éste está sujeto a factores como el cansancio, el ruido, la concentración, etc., por lo que concluyen que, aunque para fines prácticos es necesario un valor fijo, es necesario tener presente que la percepción de las diferencias tonales de la F0 es más un rango que un punto invariable. Para este proyecto de tesis se decidió usar como uno de los principales referentes y base el experimento de Pamies et al. (2001) ya que, además de que es relativamente reciente, tiene una metodología clara y se aplicó a una variedad del español, por lo que vale la pena realizar una réplica para el español del centro de México y comparar los resultados. Así, además de realizar los experimentos que nos permitan un contraste entre diferentes contextos lingüísticos, en esta tesis se diseñó un experimento basado en el de Pamies et al. (2001). * * * 20 El funcionamiento del oído humano y la percepción de los sonidos es un tema que compete a múltiples campos de estudio. Es verdad que la percepción del habla y de los elementos prosódicos son intereses de la lingüística. No obstante, la percepción de algunos elementos prosódicos como los relacionados con las emociones es un área que la psicología ha trabajado desde hace ya varias décadas. La percepción es un campo de estudio que ha sido estudiado más por la psicología que por otras ciencias y por ello es importante revisar este antecedente y considerar especialmente su metodología. En música, por otro lado, uno de los temas más relevantesy en constante discusión es la relación entre la percepción y la producción de estímulos musicales. Aunque los sonidos musicales y los lingüísticos no se comportan igual, hay elementos que pueden dar pistas para esta investigación. Respecto a la física, la acústica es una disciplina con una amplia trayectoria de estudio y resulta fundamental retomar algunos aspectos de esta área para aplicarlos en los estudios de percepción prosódica. Al compartir el mismo objeto de estudio, es entendible que los límites entre estas disciplinas parezcan difusos. La psicoacústica, por ejemplo, es una rama de la psicología y la física que también es estudiada en trabajos lingüísticos y musicales. Y es que la percepción de estímulos auditivos es un problema que, para poder abordarlo, necesita de estas cuatro aproximaciones. Por ello es necesario explicar brevemente lo que se ha hecho desde sus diferentes perspectivas. La psicoacústica estudia la percepción de los estímulos sonoros. Pero hay diferentes tipos de estímulos sonoros. Los musicales y lingüísticos, que son los más estudiados, son diferentes entre sí y la percepción de éstos se comporta de formas distintas. Sin embargo, tanto en música como en lingüística hay un amplio repertorio de trabajos experimentales cuyo objeto de estudio es la percepción de las diferencias tonales. En los estudios experimentales de música, la relación entre producción y percepción se ha estudiado con más énfasis en las últimas décadas, con el fin de saber si existe una relación significativa entre la percepción tonal y su producción. En teoría, una producción óptima en términos musicales se alcanza cuando hay una buena percepción de las diferencias tonales (Geringer, 1988). 21 Los trabajos anteriores sobre percepción musical apuntan a que la percepción de tonos agudos es menos precisa que la de los tonos graves (Geringer, 1988). Respecto a la duración, se ha observado que aquellos estímulos donde el tempo es más lento se reconocen mejor que aquellos cuyo tempo es más rápido (Geringer, 1988). Con el fin de corroborar estos supuestos, John M. Geringer (1988) realizó un experimento en el cual observó la relación entre la producción de patrones ascendentes en escalas musicales y su percepción. Para ello, usó estímulos musicales cuyo contraste radicaba en la diferencia entre tonos ascendentes y tonos planos. Los experimentos se presentaron a un grupo de 96 sujetos compuesto por estudiantes y graduados de la Escuela de Música de la Universidad Estatal de Florida. Estos sujetos se dividieron en diferentes grupos dependiendo del instrumento que practicaran, aunque a todos se les aplicaron las pruebas completas. Sus resultados apuntaron a que se reconocen mejor las diferencias ascendentes que las planas. Pero la investigación en música no se puede aplicar directamente a cuestiones lingüísticas, ya que la percepción de estímulos musicales se comporta de modo diferente a la percepción del habla. Acaso esto es porque, como se mencionó, en la prosodia se manifiestan diferentes fenómenos y la percepción recae en todos ellos, no sólo en los cambios tonales. No obstante, los resultados de esta investigación musical son interesantes, ya que en la producción lingüística los cambios ascendentes y descendentes se presentan en contextos lingüísticos diferentes e incluso su oposición puede resultar en un rasgo distintivo entre pares mínimos. Por ejemplo, la principal diferencia entre la curva melódica de una pregunta absoluta y su par mínimo declarativo recae en que la F0 de la interrogativa es ascendente al final y la de la declarativa se mantiene. No obstante, hay otras pistas prosódicas que influyen en la distinción de este par (Martín Butragueño, 2014). Es verdad que el trabajo experimental sobre la percepción entonativa no es escaso. De hecho, como se puede ver, hay muchas bases de las cuales partir para futuras investigaciones. Sin embargo, todavía falta mucho para saber exactamente cómo funciona la entonación en cuestiones perceptuales y qué tanto varía entre diferentes lenguas. Después de ver lo que se ha hecho en trabajos anteriores, se decidió enfocar esta tesis a observar la percepción de las diferencias tonales, así como su comportamiento en diferentes contextos lingüísticos. 22 23 CAPÍTULO 2 METODOLOGÍA En este capítulo se expondrá la metodología del diseño esperimental de este proyecto de tesis. Primero se explicarán las pruebas preliminares y, posteriormente, el diseño de los experimentos definitivos. También se explicarán cuestiones relacionadas con la aplicación de los experimentos, los informantes y el tamaño de la muestra. El método de análisis de resultados se desarrollará en el capítulo 3. Con el fin de encontrar el umbral de percepción1 de los cambios tonales de la F0, se desarrollaron cuatro experimentos. Éstos pueden separarse en dos fases. La primera incluye estímulos de diferentes contextos lingüísticos: uno fonemático, uno silábico y uno frástico. Se decidió hacer esta división para observar si el contexto de información lingüística influye en la percepción de las variaciones tonales. Para una comparación más transparente entre esta investigación y los trabajos que se han hecho sobre el tema, la segunda fase corresponde a estímulos bisilábicos y en ella se retoma el experimento de Pamies et al. (2001), en el que se muestran dos sílabas con variaciones tonales en sus F0 y los informantes deben identificar si las perciben como iguales o diferentes. Asimismo, cada fase tiene un experimento con estímulos de nivel —donde la curva melódica en la sección resintetizada es plana— y uno con estímulos de contorno —donde la curva melódica en la sección resintetizada es ascendente o descendente. En este capítulo se muestra en detalle el proceso del diseño experimental y de la aplicación de las pruebas. 2.1. PRUEBAS PRELIMINARES Para el diseño de los experimentos se tomaron en cuenta los trabajos anteriores, como el de Pamies et al. (2001). Sin embargo, fue necesario aplicar algunas pruebas preliminares para confirmar que los informantes realizaran la tarea correcta y que los resultados reflejaran los 1 Aunque esto se mencionó en el capítulo 1 y se explicará a detalle en el capítulo 3, es importante aclarar que, para esta tesis, se abordará el concepto de umbral de percepción como el punto de inflexión de los datos donde, por debajo de este punto estén las diferencias tonales que difícilmente se percibieron y por encima de él aquellas que se percibieron sin dificultad. 24 objetivos del experimento. De igual forma, gracias a estas pruebas se corrigieron algunos detalles metodológicos que se explicarán en este capítulo. Desde el inicio se decidió que los estímulos partieran de una grabación de voz natural y se resintetizarían para obtener las diferencias tonales deseadas. Se decidió así para que los informantes escucharan sonidos que pertenecen a su lengua y no creyeran que se trataba de sonidos no lingüísticos. A medida que se hicieron correcciones de una prueba preliminar a otra, las escalas de diferencias tonales y la cantidad de estímulos fue variando. Todas las pruebas piloto tuvieron la misma instrucción: “Tras escuchar el par de sonidos que se presenten, presione la tecla Z si considera que son iguales o la tecla M en caso de que sean diferentes”. No se les explicó en qué debían fijarse para hacer esta distinción, ya que esa explicación podría influir en su percepción. Y dado que el único elemento en que se diferenciaban los estímulos fue la altura tonal, no es probable que se hayan fijado en otro rasgo. Asimismo, siempre se aplicaron de forma individual, con audífonos y con la supervisión de que los informantes se concentraran y estuvieran en condiciones óptimas para presentar las pruebas. Es importantedestacar que, aunque la batería final se presentó a veinte sujetos, las pruebas preliminares se aplicaron a pequeños grupos de informantes, ya que el propósito de estas pruebas era únicamente mejorar la metodología para los experimentos definitivos. Así, se muestran las características de cada prueba preliminar y las discusiones que llevaron a modificar los experimentos para obtener los que se aplicaron finalmente para la investigación. 2.1.1. Primera prueba piloto Para la primera prueba sólo se realizaron experimentos para el contexto fonemático /e/, aunque desde el inicio se plantearon los diferentes contextos lingüísticos para la batería final. El objetivo de esta prueba era el de verificar que el experimento fuera viable y que las diferencias tonales entre los estímulos fueran perceptibles para los informantes. Por tal motivo, y por practicidad, sólo se usaron estímulos con voz femenina2. En esta fase de la 2 Se decidió que las grabaciones fueran de voz femenina ya que se probablemente se necesitaría hacer modificaciones y volver a grabar los estímulos. Era necesario que quien prestara su voz estuviera disponible en futuras ocasiones y para garantizar dicha disponibilidad me grabé a mí misma. 25 investigación se consideró pertinente hacer diferentes experimentos del mismo contexto lingüístico pero con escalas diferentes para ver si el grado de “dificultad” de los experimentos influiría en los resultados. Así, hubo dos fases: la primera, con tres grados de dificultad con estímulos de nivel y la segunda con dos experimentos, uno con tonos de nivel y otro con tonos de contorno3. Antes de cada una de las fases se les aplicó un experimento introductorio para que se familiarizaran con la mecánica. Estas pruebas se explicarán a detalle posteriormente. La grabación que sirvió de estímulo base corresponde a la vocal /e/ de una mujer de 22 años. Dura 200 ms y su curva melódica se mantiene en 1435 Hz aproximadamente. Para la manipulación de los estímulos se usó una escala en semitonos tanto en las pruebas preliminares como en los experimentos definitivos, pero se mencionarán las medidas de las grabaciones base tanto en hertzios como en semitonos, para tener la referencia en hertzios. Posteriormente se resintetizó la grabación en Praat (Boersma & Weenink, 2015) para eliminar las variaciones tonales y obtener una curva melódica completamente uniforme. Al igual que en todas las pruebas, sólo se modificó esto para no alterar otros elementos que influyeran en la distinción de los estímulos, como la intensidad o la duración. Como se mencionó, con el fin de que los informantes se familiarizaran con los experimentos se creó una prueba introductoria a manera de práctica, para la cual se obtuvieron siete estímulos que varían en 3 st y escalan en 1 st a partir de la base de 1435 Hz. Para obtener veinte estímulos, en el script se programaron repeticiones aleatorias de los siete estímulos resintetizados, que en total sumaran veinte. Esta prueba se presentó una vez antes del resto de los experimentos. Después de la prueba de entrada se aplicó la fase de grados de dificultad, para la cual se diseñaron tres experimentos. La grabación base corresponde a la vocal /e/ de una mujer, cuya duración es de 200ms y se mantiene aproximadamente en 1435 Hz. Es importante destacar que para todos los experimentos, exceptuando el introductorio, se establecieron periodos de descanso cada veinte estímulos, para que el informante no perdiera la concentración por agotamiento. Después de haber descansado el tiempo que el informante considerara necesario, se continuaba con la prueba. 3 Se entiende por tonos de nivel aquellos cuya curva melódica es constante pues no hay variaciones significativas en su frecuencia fundamental, y por tonos de contorno a aquellos que sí tienen variaciones ascendentes o descendentes en su frecuencia fundamental (Dryer & Haspelmath, 2013) 26 A continuación se explica la fase de los grados de dificultad. i. Prueba A. Ésta es la del grado más bajo de dificultad. Consiste en siete estímulos que varían cada uno en 1.5 st en una escala total de 9 st. La combinación de los estímulos resultó en 98 ítems que se presentaron de forma aleatoria. Tal cifra se dio ya que se presentó dos veces cada combinación posible. Se estableció que los estímulos variaran en 1.5 st, ya que la tradición prosódica toma esta medida como rango mínimo para establecer que una diferencia tonal es significativa y por lo tanto, teóricamente, no habría mayor dificultad para percibir las diferencias entre los estímulos de este grupo. ii. Prueba B. La de grado medio de dificultad, donde los siete estímulos varían en 1 st en una escala de 6 st. La cantidad de combinaciones fue la misma que para la prueba A y, de igual forma, se presentaron aleatoriamente. iii. Prueba C. Esta prueba se previó como la más difícil. Los siete estímulos de este experimento escalan en 0.5 st en una escala de 3 st. Asimismo, la cantidad de ítems y el orden en que aparecieron fue igual que en las pruebas anteriores. Cabe mencionar que en ningún momento se mencionó a los informantes que había diferentes grados de dificultad entre los experimentos, para no influir en su desempeño. Y el orden en que se aplicaron las pruebas fue aleatorio para cada informante. Al concluir la fase de grados de dificultad, se presentaron los dos experimentos cuyo objetivo fue el de estudiar las diferencias perceptuales entre los tonos de nivel y los de contorno. Para ello, se consideró pertinente diseñar dos experimentos que fuesen exactamente iguales y cuya única variante fuera la naturaleza de su curva melódica –que se mantuviera con la misma altura tonal a lo largo del estímulo o que tuviera una elevación o descenso desde el inicio hasta el final. La grabación que se utilizó para los estímulos es la misma que para la fase de grados de dificultad. i. Prueba de nivel. Para este experimento las curvas melódicas de los estímulos se resintetizaron de forma que se mantuviera sin variaciones tonales desde el inicio hasta el final de la curva, es decir, que fuera plana. El estímulo base tiene una F0 de 1435 Hz y se ubica en el número 4 en la tabla 2.1. Se usaron siete estímulos como base cuyas diferencias tonales se distribuyen de la siguiente manera: 27 Estímulo Diferencias en st respecto al estímulo base. 7 +2 st 6 +1.5 st 5 +1 st 4 (base) 0 st 3 -1 st 2 -1.5 st 1 -2 st Tabla 2.1. Distribución de los estímulos de la prueba de nivel. Primera prueba piloto. Las combinaciones de los siete estímulos resultaron en un total de 98 ítems que aparecieron de forma aleatoria durante el experimento. ii. Prueba de contorno. Al igual que para la fase de nivel, el experimento contó con 98 ítems que partieron de la combinación de los siete estímulos bases cuya organización se explica en la tabla 2.2. Como se observa en ella, el estímulo base (4) tiene una curva melódica plana porque no presenta variaciones tonales. El resto de los estímulos son de contorno pues presentan variaciones. Estímulo Diferencias en st respecto al inicio de la curva 7 +2 st 6 +1.5 st 5 +1 st 4 (base) 0 st 3 -1 st 2 -1.5 st 1 -2 st Tabla 2.2. Distribución de los estímulos de la prueba de contorno. Primera prueba piloto. Como se explicó, la única diferencia entre la prueba de nivel y la de contorno es que los estímulos de la segunda tuvieron curvas ascendentes o descendentes según el caso en particular. Al igual que en la fase de grados de dificultad, el orden en que se aplicaron las dos pruebas varió para cada informante para eliminar un posible sesgo en los resultados. Después de la aplicación de las pruebas se consideró pertinente pedir la opinión de los informantes para obtener una retroalimentación.Ellos coincidieron en que los estímulos 28 de la prueba C les parecían todos iguales; sin embargo, no consideraron que la prueba fuera difícil o agotadora. Tras revisar sus resultados, fue interesante encontrar que la prueba que tuvo un mayor número de reconocimiento fue la prueba C; los estímulos de la prueba B tuvieron un reconocimiento intermedio y la prueba A fue la que menor número de reconocimientos tuvo. 2.1.2. Segunda prueba piloto Después de analizar la primera prueba, se pensó que había que modificar la escala de las diferencias tonales, así que en la segunda prueba se planearon dos escalas diferentes. También se introdujo el segundo contexto silábico, que se representó con /ɡe/. Como se introdujo una segunda escala y otro contexto lingüístico, esta prueba constó de diez experimentos, por lo que se aplicó en dos sesiones para cada informante. Debido al gran número de experimentos, para estas pruebas ya no se aplicó el experimento introductorio. Al igual que en la primera prueba, el orden en que se aplicaron los experimentos fue aleatorio en cada informante. La única modificación que se hizo en los estímulos fue la duración de éstos. En la primera prueba, específicamente en el experimento de contorno, el reconocimiento de las diferencias fue muy bajo. Esto se atribuyó a que los estímulos duraban muy poco (200 ms) y por ellos se decidió que en esta segunda prueba los estímulos durarían 250 ms. En una primera discusión se planteó que sólo los estímulos de contorno duraran 250 ms y que el resto se mantuviera en 200 ms. Sin embargo, dado que esto añadiría un sesgo, al analizar los resultados no habría una total certeza de que lo encontrado respondiera sólo a las diferencias tonales y cabría la duda de si las diferencias en la duración influyeron en el reconocimiento en los estímulos. Para evitar ese problema, se decidió que lo óptimo sería que todos los estímulos, tanto de /e/ como de /ɡe/ duraran 250 ms. Enseguida se presentan las características de los experimentos. 29 Prueba /e/: i. Escala de siete estímulos. Esta prueba es exactamente igual a la primera prueba piloto. Incluye la fase de grados de dificultad y la de estímulos de nivel y de contorno. Aunque la duración de los estímulos cambió, como ya se mencionó, la distribución de los experimentos fue la misma que en la primera prueba piloto, tanto para la fase de grados de dificultad como para la fase de contorno. ii. Escala de cinco estímulos. Esta escala se introdujo, porque al tener menos estímulos, es posible tener más repeticiones que en la misma prueba y tener casi el mismo número de ítems. Como se mencionó, la escala de siete semitonos resultó en 98 ítems. En esta prueba, con cinco estímulos, hubo 25 combinaciones de pares posibles. Cada una de ellas se repitió cuatro veces, lo que resultó en 100 ítems. Tener más repeticiones de los estímulos permite que el análisis estadístico de los resultados sea más confiable. A continuación se presentan las dos fases de esta escala. Para la fase de grados de dificultad la dinámica es la misma que en la escala de siete estímulos, pero los ítems se distribuyen de la siguiente manera: a. Prueba A: Es el grado de dificultad más fácil. Consta de cinco estímulos que oscilan en 6 st, por lo que cada uno varía en 1.5 st. b. Prueba B: Es el grado de dificultad intermedia. De igual forma, tiene cinco estímulos, pero la escala abarca 4 st y las variaciones son de 1st. c. Prueba C: Es el grado más difícil, donde las variaciones son de 0.5 semitonos y la escala de los cinco estímulos oscila en 2 st. La fase de grados de dificultad tiene la misma dinámica que la de escala de siete estímulos, pero dado que sólo fueron cinco estímulos base, la distribución también cambió. a. Prueba de nivel. Para este experimento, el estímulo base tiene una F0 de 1460 Hz y se muestra en el número 3 en la tabla 2.3. Se usaron siete estímulos como base, cuyas diferencias tonales se distribuyen de la siguiente manera: 30 Estímulo Diferencias en st respecto al estímulo base. 5 +1.5 st 4 +1 st 3 (base) 0 st 2 -1 st 1 -1.5 st Tabla 2.3. Distribución de los estímulos de la prueba de nivel. Segunda prueba piloto. b. Prueba de contorno. El estímulo base de este experimento es el único cuya curva melódica es plana pues se mantiene en 1460 Hz. Los otros cuatro estímulos presentan las elevaciones y descensos correspondientes al final de la curva. La distribución de éstos puede verse en la siguiente tabla: Estímulo Diferencias en st respecto al inicio de la curva 5 +1.5 st 4 +1 st 3 (base) 0 st 2 -1 st 1 -1.5 st Tabla 2.4. Distribución de los estímulos de la prueba de contorno. Segunda prueba piloto. Prueba /ɡe/: Para eliminar variaciones metodológicas que provocaran sesgos en los resultados, el diseño de esta prueba es exactamente igual que el del contexto fonemático. La única variación entre estos dos contextos es la grabación base. Se decidió que la sílaba que representaría al contexto silábico fuera /ɡe/, para que la vocal fuera la misma que en el contexto previo y porque el fonema consonántico /ɡ/ no altera significativamente la F0 de las vocales que le siguen en la emisión, así que no representaría mayor dificultad al resintetizar los estímulos. Para obtener la sílaba /ɡe/ de este contexto también se usó una voz femenina. Se cuidó que la duración de estos estímulos también fuera de 250 ms y la distribución de las escalas y la aplicación de los experimentos fue la misma que para /e/. 31 Es necesario mencionar que, al igual que en la primera prueba piloto, en todos los experimentos hubo periodos de descanso. Éstos se dieron, también, cada veinte estímulos. Sin embargo, a pesar de estos periodos de descanso y de que las pruebas se aplicaron en dos sesiones, los informantes coincidieron en que eran demasiados experimentos y que resultaba difícil mantener la concentración. Al revisar los resultados se observó que, efectivamente, el nivel de reconocimiento de las diferencias era muy bajo y, aunque la duración de los estímulos ayudó a que se percibieran más diferencias que en la primera prueba piloto, se decidió que era necesario hacer varias modificaciones al diseño de los experimentos. 2.1.3. Tercera prueba piloto Esta prueba se pensó en un principio como el experimento definitivo, aunque posteriormente se realizaron algunas últimas modificaciones que se explicarán más adelante. Ya que los estímulos de la segunda prueba piloto fueron satisfactorios, se decidió que ese aspecto no se modificaría. Sin embargo, se replanteó la distribución de las pruebas. Con el fin de tener una menor cantidad de experimentos y que estos siguieran cumpliendo con las tareas de las pruebas anteriores, se decidió optimizar la distribución de los estímulos. Se consideró que tener una fase de grados de dificultad no era necesario y que la prueba de estímulos de nivel, con las respectivas modificaciones, podría cumplir la misma función que la de los grados de dificultad. Asimismo, se introdujo el tercer contexto lingüístico y el experimento con estímulos bisilábicos basado en el trabajo de Pamies et al. (2001). De esa forma, se obtuvieron ocho experimentos: el fonemático, silábico y frástico de estímulos de nivel, el bisilábico de estímulos de nivel y los mismos cuatro pero con estímulos de contorno. i. Prueba de contextos lingüísticos. Como se mencionó, el estímulo base de 250 ms de voz femenina se mantuvo. Sin embargo, como se contempló como el experimento definitivo, se agregó también la grabación de la voz masculina, cuidando que la intensidad fuera lo más similar posible a la de la voz femenina y también que su duración fuera de 250 ms. Aunque jamás se planeó oponer un estímulo de voz femenina con uno de voz masculina porque la identificación sería obvia, se cuidóque fueran similares para que hubiera uniformidad en el experimento. 32 El objetivo de los grados de dificultad era tener diferentes rangos en las diferencias tonales, pero después de analizar las pruebas, se llegó a la conclusión de que esto se podría lograr sin necesitar de hacer tantos experimentos. Por ello, se crearon cinco estímulos cuyas combinaciones resultaron en trece diferencias tonales, y cada una de las cuales se repitió ocho veces, lo cual dio un total de 104 ítems de voz femenina y 104 de voz masculina. En total, cada uno de los experimentos de contextos lingüísticos estaba formado por 208 ítems. En la tabla 2.5 se explica la distribución de los estímulos para un solo género (104 ítems): Diferencia en semitonos entre los dos estímulos Combinación de los estímulos4 Repeticiones Total de ítems -3 st 5-1 8 8 -2.5 st 5-2 4 8 4-1 4 -2 st 4-2 8 8 -1.5 st 5-3 4 8 3-1 4 -1 st 4-3 4 8 3-2 4 -0.5 st 5-4 4 8 2-1 4 0 st 5-5 2 8 1-1 2 3-3 2 2-2 1 4-4 1 0.5 st 4-5 4 8 1-2 4 1 st 3-4 4 8 2-3 4 1.5 st 3-5 4 8 1-3 4 2 st 2-4 8 8 2.5 st 2-5 4 8 1-4 4 3 st 1-5 8 8 Tabla 2.5. Distribución de los estímulos para las pruebas de contextos lingüísticos. 4 En el experimento hay sólo cinco estímulos. El número 1 corresponde a -1.5 st, 2 a -1 st, el 3 a 0 st, el 4 a 1 st y el 5 a 1.5 st. Las diferentes combinaciones entre ellos proporcionan 13 escalones en semitonos. Se distribuyeron de dicha manera para que en el experimento hubiera la misma cantidad de repeticiones para cada escalón y que no hubiera una diferencia tonal que tuviera mayor frecuencia de aparición que otra, ya que esto provocaría alteraciones en los resultados. 33 Como se ve en la tabla 2.5, se cubren todas las diferencias tonales que en la prueba de grados de dificultad, por lo que no afectó su eliminación. Además, se cuidó que cada una de esas diferencias tuviera la misma cantidad de repeticiones, porque tras analizar las pruebas previas se descubrió que, aunque los estímulos tenían las mismas repeticiones, había diferencias tonales con más apariciones que otras y eso podría ser un problema al analizar los resultados. A continuación se explica cada uno de los contextos de la prueba: a. Contexto fonemático. Como ya se mencionó, se continuó con la vocal /e/ para este contexto, y los cinco estímulos base que se usaron fueron los mismos que para la segunda prueba piloto, por lo que los estímulos de nivel se explican con la tabla 2.3 y los de contorno con la tabla 2.4. Al igual que en las pruebas anteriores, se aplicaron de forma separada, por lo que se obtuvo un experimento con estímulos de nivel de la vocal /e/ y otro con estímulos de contorno de la misma vocal, cada uno con 208 ítems, como ya se mencionó. b. Contexto silábico. Al igual que en el contexto fonemático, se conservaron los mismos cinco estímulos base de la segunda prueba con la sílaba /ɡe/ y sólo cambió la distribución de los estímulos para que cada contexto lingüístico coincidiera con lo planteado en la tabla 5 tanto para el experimento de nivel como para el de contorno. c. Contexto frástico. Como este contexto no se incluyó en las pruebas anteriores, se tuvo que hacer una nueva grabación para este experimento. Se decidió que la frase debía ser breve y que la última sílaba, que sería la resintetizada, debía ser sonora. Por ello se eligió La luna. Esta grabación dura 600 ms, pero la sílaba que se resintetizó fue sólo /na/ y su duración es de 250 ms, como en los contextos anteriores. De igual forma, se obtuvieron cinco estímulos para conseguir los 208 ítems del experimento de nivel y los otros 208 para el de contorno. ii. Prueba de estímulos bisilábicos. Ya que estos experimentos están basados en el de Pamies et al. (2001), es conveniente contrastar algunos matices en las dos metodologías. En primera instancia, Pamies et al. (2001) sólo hicieron una prueba con estímulos de nivel. Sin embargo, para que el experimento de esta tesis fuera 34 contrastable con aquellos de la fase de contextos lingüísticos, se decidió agregar la prueba de contorno. Tanto el experimento de Pamies et al. (2001) como el de esta investigación consisten en un test de audición de secuencias bisílabas donde los informantes deben indicar si escuchan sílabas iguales o diferentes entre sí. Los estímulos parten de grabaciones de habla natural de hombre y de mujer, resintetizadas igual que los de la fase anterior. Los estímulos de Pamies et al. (2001) fueron resintetizados con el ASL de KAY, mientras que los del presente trabajo se modificaron con Praat (Boersma & Weenink, 2015). No obstante, esta diferencia metodológica no es significativa, ya que usar un programa u otro en la resintetización no tendría por qué provocar diferencias importantes en los estímulos finales, pues se llegó a los mismos resultados. Para obtener los estímulos bisilábicos, Pamies et al. (2001) grabaron tanto en voz femenina como en voz masculina la sílaba /ba/. Después, la duplicaron para que los estímulos tuvieran dos sílabas exactamente iguales y al resintetizar los estímulos sólo se modificaron las segundas sílabas para obtener las diferencias tonales deseadas. Así, en su experimento no se contrastaron dos estímulos, sino las dos sílabas de un mismo estímulo. Para seguir con su metodología, esta parte del diseño experimental se siguió al pie de la letra para la presente tesis. Aunque en el reporte de Pamies et al. (2001) no está explícito, se infiere que el experimento se aplicó a un grupo de informantes al mismo tiempo y no se menciona si esto fue con audífonos o no. Asimismo, los informantes registraron sus respuestas en hojas marcando “iguales” si consideraban que los estímulos eran iguales o “diferentes” en el caso de que percibieran diferencias entre ellos. La aplicación de los experimentos de esta investigación se realizó siguiendo la misma metodología que en la fase de los contextos lingüísticos, es decir, con audífonos, de forma individual y con el programa Praat (Boersma & Weenink, 2015). La escala del experimento de Pamies et al. (2001) fue de -2 st a 2 st con variaciones de medio semitono entre los estímulos (-2 st, -1.5 st, -1st, -0.5 st, etc.) y los estímulos isotonales donde la diferencia fue de 0 st se repitieron seis veces (tres para voz masculina y tres para voz femenina). Por lo tanto, tuvieron 22 estímulos: once en voz masculina y once en voz femenina. El experimento de este trabajo varía 35 parcialmente en ese aspecto. Con el fin de tener más repeticiones de los estímulos se usó la escala de -2 st a 2 st y las variaciones tonales de éstos se explican en la tabla 2.6. Estímulo Diferencias en st respecto a la primera sílaba 7 +2 st 6 +1.5 st 5 +1 st 4 (base) 0 st 3 -1 st 2 -1.5 st 1 -2 st Tabla 2.6. Distribución de los estímulos para el experimento bisilábico. Cada estímulo se repite quince veces en el experimento, y tomando en cuenta que son dos géneros, se obtuvo un total de 210 ítems para el experimento. Esta vez, los periodos de descanso dentro de cada experimento se dieron cada 40 ítems. La razón por la cual no se siguió la escala propuesta por el experimento original es porque resulta más certero analizar los datos y establecer un umbral cuando la cantidad de repeticiones de los diferentes estímulos es igual. Al igual que en el resto de los experimentos, para esta prueba hubo un experimento con estímulos de nivel y otro con estímulos de contorno, los dos con la misma distribución de estímulos y sus diferencias tonales. Estos experimentos, aunque se pensaron como los definitivos, sólo se aplicaron a cinco informantes con la intención de revisar sus resultados y posteriormente aplicarlos a los quince restantes. Sin embargo, tras revisarlos se encontró que, aunque sí reconocían las diferenciastonales, este reconocimiento era menor al 50%. Asimismo, cuando se pidió la opinión de los informantes, comentaron que les pareció muy difícil y tedioso escuchar los mismos estímulos uno tras otro, ya que eran demasiados para mantener la concentración y su desempeño bajaba durante la aplicación de las pruebas. Por ello, se decidió que era necesario una última modificación para aplicar los experimentos y que la tarea se cumpliera satisfactoriamente. 36 2.2. EXPERIMENTOS DEFINITIVOS Tras discutir los problemas de la tercera prueba piloto se decidió que, para no alterar por completo los experimentos y resolver el problema planteado, la solución más conveniente era aplicar un solo experimento donde se presentaran los tres contextos lingüísticos y otro experimento para el de estímulos bisilábicos. De esta forma el experimento presentaría de forma aleatoria los estímulos fonemáticos, los silábicos y los frásticos y los informantes mantendrían la concentración durante toda la prueba. Se llegó a la conclusión de no incluir en el mismo experimento a los estímulos bisilábicos porque, aunque los experimentos son muy similares, las tareas no son exactamente las mismas y mezclarlos podría causar confusión entre los informantes. Así, se obtuvieron cuatro experimentos: el de contextos lingüísticos con estímulos de nivel, el de estímulos bisilábicos con estímulos de nivel, el de contextos lingüísticos con estímulos de contorno y el de estímulos bisilábicos con estímulos de contorno. Enseguida se explican estos experimentos. 2.2.1. Fase de contextos lingüísticos Al juntar los tres experimentos, se obtuvieron 624 ítems, por los que se cambiaron los periodos de descanso para que ahora se presentaran cada 50 estímulos. Como se mencionó, estas pausas no tienen un tiempo establecido, por lo que los informantes son libres de descansar lo que consideren necesario para realizar el experimento completo en sus mejores condiciones. Sin embargo, aplicaron los experimentos en dos sesiones para dividir las horas de trabajo. De esa forma, se aplicaron dos experimentos en la primera sesión y los dos restantes en la segunda sesión. El orden de aplicación, como en la tercera prueba piloto, también fue aleatorio para cada informante. Los estímulos que se usaron para la prueba de nivel y para la de contorno fueron exactamente iguales, pero como la distribución de estos cambió, es conveniente detallar estos cambios. En el anexo 1 se presenta el script del experimento. El script que se usó como plantilla se obtuvo del taller Laboratory Approaches to Romance Phonology 6, impartido por Miquel Simonet en El Colegio de México del 3 al 5 de octubre del 2012. Posteriormente, se hicieron las modificaciones necesarias para adaptarlo a las necesidades del experimento. Con el fin de explicarlo, se agregaron incisos en negritas a las líneas del script que se comentarán a continuación. 37 (A). Especifica que los estímulos son sonidos. (B). El primer texto entre comillas corresponde a la carpeta en la que se encuentras los archivos que se usaron en el experimento. En este caso, corresponde a la carpeta de estímulos de nivel. El segundo texto entre comillas especifica el tipo de archivo con la extensión .wav. (C). En esta línea se estable el tiempo que debe transcurrir para que se presenten los estímulos, el cual es de 0.5 s. (D). Indica el tiempo de espera entre el primer y el segundo estímulo a contrastar, que es de 0.5 s. (E). En esta línea se señala que el experimento está compuesto por 624 estímulos y, posteriormente, se presentan éstos. Como se observa, sólo se muestran los nombres de los estímulos y están en clave. La primer cifra de la clave es numérica y corresponde al número de estímulos, la segunda cifra es alfabética y corresponde al género (H para masculino y M para femenino) y la tercera también es alfabética y corresponde al contexto lingüístico (E para /e/, G para /ɡe/ y L para La luna). De esta forma, “5HE, 1HE” corresponde a la comparación del quinto estímulo de /e/ en voz masculina con el primer estímulo de /e/ en voz masculina. (F). Esta línea indica el número de repeticiones de cada estímulo. Como cuando se presentaron los estímulos, en (E), se introdujeron las repeticiones necesarias, en esta línea se especificó que no habría más repeticiones. Esto se hizo porque, como se explica en la tabla 5, algunos estímulos tienen más apariciones que otros para que hubiera la misma cantidad de diferencias tonales, por lo cual no se podía poner el mismo número de repeticiones para todos dentro del script y se tuvieron que especificar los 624 ítems. (G). Aquí se establecen los periodos de descanso, que se programaron para que aparecieran cada 50 estímulos. (H). Con esa instrucción se elimina la posibilidad de que dos estímulos iguales aparezcan de forma consecutiva, aunque automáticamente los estímulos se presenten de forma aleatoria. (I). Esta línea corresponde a la instrucción que se presenta al inicio del experimento. 38 (J). La instrucción que se muestra aparece todo el tiempo en la parte superior central de la pantalla de Praat (Boersma & Weenink, 2015) mientras se responde el experimento. Esto se muestra en la figura 2.1. Figura 2.1. Toma de pantalla donde se muestra la aplicación del experimento de contextos lingüísticos. (K). Esta instrucción se muestra en los periodos de descanso para indicar al informante que no tiene un tiempo restringido. (L). Esta línea muestra la leyenda que se muestra al final del experimento. (M). Con esa instrucción se elimina la posibilidad de que el informante repita el estímulo. (N). Ya que no existe la opción de un botón de repetición, es esta línea no se agrega dicho botón. (O). Como no se puede decir que lo que percibe un informante es un acierto o un error, no se agregó en el experimento la retroalimentación de “correcto” o “incorrecto” en cada respuesta, por lo que en estas dos líneas no se agregan dichos botones. (P). Aquí se indica que las respuestas no son audios. (Q). En estas líneas se indica que hay dos respuestas posibles: iguales y diferentes, que corresponden a la tecla “z” y “m” respectivamente. 39 (R). Como se mencionó, no hay respuestas correctas o incorrectas, por lo que esta línea se dejó vacía. Aunque el script corresponde al experimento de estímulos de nivel, el de estímulos de contorno tiene exactamente la misma estructura, sólo que la carpeta en donde busca los estímulos contiene los de contorno. 2.2.2. Fase de estímulos bisilábicos Como esta prueba fue más breve que la de contextos lingüísticos, se decidió que no se modificaría nada. Además, se intentó que fuera lo más similar posible a la de Pamies et al. (2001), por lo que se dejó exactamente igual a la que se explicó en la tercera prueba piloto. No obstante, al igual que para la fase de contextos lingüísticos, en el anexo 2 se muestra el script que se usó para el experimento y cuya plantilla fue la misma. Enseguida se explican los incisos que se añadieron. Como se puede ver, sólo se explican las líneas que no son iguales a las del primer script. (A). Dado que para este experimento los estímulos se repitieron las mismas veces, sólo se presentaron los catorce estímulos base; los siete con voz femenina y los siete con voz masculina. Como se explicó, en este experimento no se contrastan dos estímulos, sino que la distinción se da dentro de las dos sílabas de cada estímulo presentado, por lo que la explicación de las claves es la siguiente: la primera cifra, que es numérica, corresponde al número del estímulo y la segunda cifra, alfabética, corresponde al género. Así, “1H” representa el primer estímulo de voz masculina. (B). En esta línea se indica que cada estímulo debe repetirse 15 veces, para obtener un total de 210 ítems. (C). Ya que este experimento es más breve que el de contextos
Compartir