Logo Studenta

Chion-Michel-La-audiovision-Introduccion-a-un-analisis-conjunto-de-la-imagen-y-el-sonido

¡Este material tiene más páginas!

Vista previa del material en texto

MICHEL CHION 
 
 
 
La audiovisión 
 
Introducción 
a un análisis conjunto 
de la imagen y el sonido 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
PAIDOS Comunicación 
 
Nº 53 
 
Título original: L 'audio-vision 
Publicado en francés por Éditions Nathan. París 
 
Traducción de Antonio López Ruiz 
Cubierta de Eskenazi & Asociados 
 
 
 
 
 
@ 1990 by Éditions Nathan, Paris 
@ de todas las ediciones en castellano. Ediciones Paidós Ibérica, S. A., 
Mariano Cubí. 92 -08021 Barcelona y Editorial Paidós, SAICF, 
Defensa, 599 -Buenos Aires. 
ISBN: 84-7509-859-2 
Depósito legal: B- 3.948/1993 
Impreso en Hurope. S.A.. 
Recaredo, 2 -08005 Barcelona 
Impreso en España 
 
 
 
 
 
 
 
 
 
 
GUEST
1ª edición 1993 
Sumario 
Introducción 10 
 
 
PRIMERA PARTE 
EL CONTRATO AUDIOVISUAL 
 
1. Proyecciones del sonido sobre la imagen 12 
 
I. La ilusión audiovisual 12 
II. El valor añadido, definición 13 
III. Valor añadido por el texto 13 
III.1 Vococentrismo y verbocentrismo del cine 13 
III.2 El texto estructura la visión 14 
 
IV Valor añadido por la música 15 
IV. 1 Efecto empático y anempático 15 
IV. 2 Ruidos anempáticos 16 
 
V. Influencias del sonido en las percepciones del movimiento y la velocidad 16 
V.1 El sonido es movimiento 16 
V.2 Diferencia de velocidad perceptiva 17 
V.3 Consecuencias: movimientos visuales punteados o creados como una 
ilusión por el sonido 18 
V.4 Las almenas temporales del oído 19 
 
VI. Influencia del sonido sobre la percepción del tiempo en la imagen 19 
VI.1 Los tres aspectos de la temporalización 19 
 - animación temporal de la imagen 19 
 - linealización temporal de los planos 20 
 - vectorización 20 
 
VI.2 Condiciones para una temporalización de las imágenes por el sonido 20 
Primer Caso: la imagen no por sí misma tiene animación temporal ni 
 vectorización 20 
 Segundo Caso: la imagen implica una animación temporal propia 20 
 Factores de la temporalización: 20 
- naturaleza del mantenimiento del sonido 20 
- previsibilidad o imprevisibilidad sonora 20 
- papel del tempo 21 
- definición del sonido 21 
- modelo de integración entre sonido e imagen 21 
- distribución de los puntos de sincronización 21 
 
VI.3 El cine sonoro es una cronografía 22 
VI.4 Linealización temporal 22 
VI.5 Vectorización del tiempo real 23 
VI.6 El estridor y el trémolo: carácter cultural o natural de esta influencia 24 
 
VI. Ejemplo de la reciprocidad del valor añadido: 
los sonidos de lo horrible 25 
2. Las tres escuchas 28 
I. Primera actitud de escucha: la escucha causal 28 
I.1 Definición 28 
I.2 Naturaleza de la identificación causal 28 
I.3 La fuente es un cohete de varios cuerpos 29 
 
II. Segunda actitud de escucha: la escucha semántica 30 
III. Tercera actitud de escucha: la escucha reducida 30 
III.1 Definición 30 
III.2 Exigencias de la escucha reducida 31 
III.3 Para qué sirve la escucha reducida 32 
III.4 Acusmática y escucha reducida 32 
IV. Oír/ escuchar y ver/ mirar 33 
3. Líneas y puntos 35 
I. La cuestión de lo horizontal y de lo vertical 35 
I.1 ¿Armonía o Contrapunto? 35 
I.2 La disonancia audiovisual 36 
I.3 Predominio de las relaciones verticales en la cadena audiovisual 
(no hay banda sonora) 37 
 
II. El sonido y la imagen en relación con la cuestión del montaje 38 
II. 1 El montaje de los sonidos no ha creado una unidad específica 38 
II. 2 Posibilidad de un montaje audible de los sonidos 39 
II. 3 ¿Forma un plano de sonido un tramo de sonido audible? 40 
II. 4 La condición para un lugar del sonido 41 
II. 5 Unidades, pero no específicas 42 
II. 6 El flujo sonoro: lógica interna, lógica externa 42 
 
III. El sonido en la cadena audiovisual 44 
III.1 Reunir: El agregado 44 
III.2 Puntuar 44 
III.3 Puntuaciones simbólicas mediante la música: 
 el ejemplo de “El Delator” 45 
III.4 Utilización puntuadora de los Elementos del Decorado Sonoro (E.D.S) 49 
III.5 Convergencias / Divergencias: la Anticipación 50 
III.6 Separar: el Silencio 51 
IV. El punto de Sincronización: la Síncresis 52 
IV.1 Definición 52 
IV.2 Punto de sincronización evitado 53 
IV.3 El golpe, símbolo del punto de sincronización 54 
IV.4 “P.D.S.” acentuados y elasticidad temporal 55 
IV.5 El resorte de la sincronización: la síncresis 56 
IV.6 Sincronismo amplio, medio y estrecho 57 
 
4. La escena audiovisual 58 
I. ¿Hay una escena sonora? 58 
I.1 La imagen es el marco 58 
I.2 No hay continente sonoro de los sonidos 59 
 
II. Imantación espacial del sonido por la imagen 60 
 
III. La acusmática 62 
III.1 Definición 62 
III.2 Visualidad / Acusmática 62 
 
IV. La cuestión del fuera de campo 63 
IV.1 Fuera de campo in y off: el tricírculo 63 
IV.2 Las excepciones destruyen la regla (gráfico 1 – pág 64) 63 
IV.3 El punto de vista topológico y espacial 65 
IV.4 El Sonido Ambiente (Sonido Territorio) 65 
IV. 5 El Sonido Interno 65 
IV. 6 El sonido On the Air (gráfico 2 – pág 67) 65 
IV. 7 Lugar del sonido y lugar de la fuente 67 
 
V. La excepción de la música 68 
V.1 Música de foso y música de pantalla 68 
V.2 La música como plataforma espacio-temporal 69 
 
VI. Fuera de campo relativo y fuera de campo absoluto 70 
VI.1 El “Fuera de Campo” sólo es una relación 70 
VI.2 Efecto de bastidores y Fuera de Campo – Cubo de Basura 
(en el cine en el multipista) 71 
VI.3 Fuera de Campo Activo y Fuera de Campo Pasivo 72 
VII. La extensión 73 
VII.1 Modulación del Campo y del Fuera de Campo visual por el sonido 73 
VII.2 Las Variaciones de la extensión 74 
VIII. El punto de escucha 75 
VIII.1 Punto de escucha en sentido espacial y en sentido subjetivo 75 
VIII.2 Dificultades de definir criterios acústicos para un punto de escucha 76 
VIII.3 Es la imagen la que crea el punto de escucha (subjetivo) 77 
VIII.4 Voz de enfrente y voz de espalda 77 
VIII.5 Escotomización del micro-oído 78 
 
 
 
 
5. Lo real y lo expresado 80 
I. La ilusión unitaria 80 
II. Problemática de la reproducción sonora 81 
II.1 Definición y fidelidad 81 
II.2 Aislamiento y desconexión de los valores sonoros 
(ejemplo: la concepción acústica del sonido THX) 82 
 
II.3 la cuestión de la fotogenia: el dispositivo técnico 84 
II.4 Los silencios del Sonido Directo 86 
II.5 Verdad y Verosimilitud sonora 88 
 
III. Expresión y reproducción 90 
III.1 ¿Qué es la expresión? 90 
III.2 Lo expresado es una bola de sensaciones 91 
III.3 Los Indicios Sonoros Materializadores (I.S.M.) 93 
III.4 Dos ejemplos de expresión: “El Oso” y “quién engañó a Roger Rabbit” 95 
III.5 El sonido en la animación: Sonorizar los trayectos 97 
 
 
 
 
 
 
 
 
 
 
6. La audiovisión en negativo 100 
I. Más allá de la imagen 100 
II. Un cuerpo en el vacío: el hombre invisible 101 
III. El acúsmetro 103 
III.1 Definición 103 
III.2 Poderes del acúsmetro 104 
III.3 La desacusmatización 105 
IV. La suspensión 105 
V. Visuales del oído, auditivos de la vista 107 
V.1 Un visual que deja huellas sonoras 107 
V.2Los visuales del oído 108 
V.3 ¿Temporal = Sonido y Espacial = Imagen? 109 
VI. La transensorialidad: ejemplo del ritmo 109 
 
 
 
SEGUNDA PARTE 
MAS ALLA DE LOS SONIDOS Y DE LAS IMÁGENES 
 
7. Digno del nombre sonoro 112 
I. Sesenta años de añoranzas 112 
II. Una definición ontológicamente visual 113 
III. Efectos directos o indirectos del sonido multipistas 114 
III.1 Rehabilitación / Afirmación del Ruido 114 
III.2 Ganancia en Definición 116 
III.3 Infusión del sonido en la imagen 117 
III.4 Supercampo: influencia en el dècoupage 118 
IV. Hacia un Cine sensorial 119 
IV.1 ¿Una crisis? 119 
IV.2 Retorno al cine mudo: el continuum sensorial 121 
 
 8. Televisión, clip, vídeo 123 
I. La televisión: una imagen añadida 123 
II. El deporte acústico 124 
III. La boca y el video 125 
III.1 Fija o en movimiento, la imagen es la misma 125 
III.2 Una imagen rápida como texto 127 
III.3 El arte del vídeo y el lugar del sonido 127 
IV. La radio con imágenes 128 
 9. Hacia una audiologovisual 131 
I. Libertad del texto en el cine mudo 131 
II. La palabra-teatro 132 
III. La palabra-texto 133 
III.1 Definición 133 
III.2 Desafío entre palabra-texto e imagen 134 
III.3 Un caso particular: el texto errante 135 
 
IV. La palabra-emanación 136 
IV.1 Definición 136 
IV.2 Modos de relativización de la palabra en el cine hablado 137 
- rarefacción 138 
- proliferación y adlibs 138 
- poliglotia o empleo de una lengua extranjera 138 
- palabra inmersa 139 
- pérdida de inteligibilidad 139 
- descentrado 140 
 
V. Una integración sin fin 141 
 
10. Introducción a un análisis audiovisual 142 
I. La exigencia verbal 142 
II. Procedimiento de observación 143 
II.1 Método de los ocultadores 143 
II.2 Matrimonio a la fuerza 144 
 
III. Esbozo de un cuestionario tipo 145 
III.1 Búsqueda de dominancias y descripción de conjunto 145 
III.2 Localización de los puntos de sincronización importantes 145 
III.3 Comparación 146 
 
IV Trampas y hallazgos del análisis audiovisual ejemplos sobre un 
fragmento de La Dolce Vita de Fellini 147 
V. Análisis del prólogo de Persona, de Bergman 151 
V.1 Descripción plano por plano 151 
V.2 Esbozo de Análisis Audiovisual 156 
- localización de las dominancias 156 
- localización de los puntos de sincronización 157 
- análisis narrativo 157 
- comparación 160 
- la tela audiovisual 161 
 
Bibliografía esencial 163 
Índice de filmes citados 165 
 
INTRODUCCIÓN 
 
Hasta hoy, las teorías sobre el cine, en conjunto, han eludido prácticamente la 
cuestión del sonido: unas veces dejándola de lado y otras tratándola como un terreno 
exclusivo y menor. Aunque algunos investigadores hayan propuesto aquí y allá enfoques 
muy valiosos sobre la cuestión, sus aportaciones (y las mías, en las tres obras que ya he 
publicado sobre el tema) no han ejercido aún suficiente influencia como para imponer una 
reconsideración del conjunto del cine, en función del lugar que en él ocupa el sonido desde 
hace sesenta años. 
Sin embargo, las películas, la televisión y los medios audiovisuales en general no se 
dirigen sólo a la vista. En su espectador -su «audio-espectador»- suscitan una actitud 
perceptiva específica que, en esta obra, proponemos llamar la audiovisión. 
Una actividad que, curiosamente, nunca se ha considerado en su novedad: sigue 
diciéndose «ver» una película o una emisión, ignorando la modificación introducida por la 
banda sonora. O bien se considera suficiente un esquema aditivo. Asistir aun espectáculo 
audiovisual vendría a ser en definitiva ver las imágenes más oír los sonidos, permaneciendo 
dócilmente cada percepción en su lugar. 
El objeto de este libro es mostrar cómo, en realidad, en la combinación audiovisual, 
una percepción influye en la otra y la transforma: no se «ve» lo mismo cuando se oye; No sé 
«oye» lo mismo cuando se ve. 
El problema, pues, no nace de una supuesta redundancia entre los dos campos, ni de 
una relación de fuerzas entre ellos (la famosa pregunta, planteada en los años 70: «¿Qué es 
más importante, el sonido o la imagen?. 
Esta obra es a la vez teórica y práctica, puesto que, habiendo descrito y formulado la 
relación audiovisual como contrato (es decir, como lo contrario de una relación natural que 
remitiese a una armonía preexistente de las percepciones entre sí), esboza un método de 
observación y de análisis, susceptible de aplicarse a las películas, a las emisiones de 
televisión, a los vídeos, etc., y nacido de nuestras numerosas experiencias pedagógicas. 
Dada la novedad de la perspectiva aquí propuesta, se me perdonará que no sea ni 
definitivo, ni exhaustivo. 
En relación con los tres libros ya publicados sobre el tema en las ediciones de 
Cahiers du Cinéma (La Voix au cinéma, Le Son au cinéma, La Toile trouée), el lector 
encontrará aquí nociones ya abordadas, pero también una conceptualización más amplia, 
una presentación más sistemática y muchos avances inéditos. 
Los capítulos que constituyen la primera parte, «El contrato audiovisual», recapitulan 
una serie de respuestas posibles; los siguientes, «Más allá de los sonidos y de las 
imágenes», intentan formular las preguntas y superar las barreras establecidas y las 
visiones demasiado compartimentadas. 
El cine es el principal afectado, pero los casos particulares de la televisión, del vídeo y 
del clip se consideran en un capítulo aparte. 
Siendo la percepción sonora la peor conocida y la menos ejercitada, se plantean al 
principio del volumen ciertas bases de aculogía, es decir, de teoría de la escucha y del 
sonido. Para más detalles sobre estas cuestiones, remitimos a nuestra Cuide des objets 
sonores (INA/Buchet-Chastel). 
Esta investigación debe mucho a reuniones e intercambios con estudiantes del 
IDHEC, del IDA, del DERCA V, del INSAS de Bruselas, del Centre Parisien d 'Études 
Critiques de París, de la École des Arts de Lausana, de la asociación Gen Lock de Ginebra, 
de la ACT de Toulouse y de la Universidad de Iowa City. Nuestro agradecimiento a los 
animadores y responsables de estos diferentes centros, así como, por sus fructíferos 
comentarios, a Christiane Sacco-Zagaroli, Rick Altman, Patrice Rollet y, por su- puesto, a 
Michel Marie, a quien este libro debe su existencia 
 
M. C. 
 
PRIMERA PARTE 
 
 
 
 
 
 
EL CONTRATO AUDIOVISUAL 
 
 
 
 
 
 
 
 
 
1. Proyecciones del sonido sobre la imagen 12 
 
2. Las tres escuchas 28 
 
3. Líneas y puntos 34 
 
4. La escena audiovisual 58 
 
5. Lo real y lo expresado 80 
 
6. La audiovisión en negativo 100 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1. Proyecciones del sonido sobre la imagen 
 
 
I. LA ILUSIÓN AUDIOVISUAL 
 
La sala queda a oscuras, empieza la película. En la pantalla se suceden imágenes 
brutales, enigmáticas: una proyección de cine, la película en primer plano. Escenas 
traumatizadoras de animales sacrificados. Una manoclavada. Luego: un depósito de 
cadáveres, en el que se desliza el tiempo cotidiano; en este depósito, un niño que parece al 
principio un cuerpo como los demás, y que en realidad se agita, vive, lee un libro, acerca su 
mano a la superficie de la pantalla, y bajo esa mano parece modelar el rostro de una mujer 
muy hermosa. 
He aquí lo que hemos visto. He aquí la secuencia-prólogo de Persona de Bergman, 
que ha sido analizada, en distintos libros y clases, por un Rayrnond Bellour, un David 
Bordwell o una Marylin Johns Blackwell. Y la película podría seguir desarrollándose así. 
¡Alto! 
 
Rebobinamos la película de Bergman hasta el principio y ahora, sencillamente, 
cortamos el sonido, para intentar ver la película olvidando lo que hemos visto antes. Lo que 
«vemos» ahora es otra cosa. 
En primer lugar, el plano de la mano clavada: en el silencio, se nos revela que se trataba de 
tres planos distintos, cuando no habíamos visto sino uno, porque estaban encadenados 
mediante el sonido. y sobre todo, privada de sonido, la mano clavada es algo abstracto. 
Sonorizada, es aterradora, real. Las imágenes del depósito: sin el sonido que las enlazaba 
(un goteo de agua), descubrimos en ellas una serie de fotografías fijas, fragmentos de 
cuerpos humanos aislados los unos de los otros, desprovistos de espacio y de tiempo. y la 
mano derecha del muchacho, sin la nota vibrante que acompaña y estructura su exploración, 
ya no da forma al rostro, evoluciona simplemente al azar , sin finalidad. Toda la secuencia 
ha perdido su ritmo y su unidad. ¿Es acaso Bergman un realizador sobrevalorado? ¿Era el 
sonido la máscara de una imagen vacía? 
Observemos por otra parte una conocida secuencia de Tati, en Las vacaciones de 
Monsieur Hulot: en una pequeña playa, se desarrollan unos sutiles gags que nos hacen reír. 
¡ Y los veraneantes resultan tan graciosos con su aspecto cohibido, aburridos, in- quietos! 
Aquí lo que eliminamos son las imágenes y... ¡sorpresa! Como el reverso de la 
imagen aparece otra película, que «vemos» ahora sólo con nuestro oído: gritos de niños que 
se divierten y que juegan, voces que resuenan en un espacio abierto, todo un universo de 
juego y de animación. ¡Todo esto estaba allí, en el sonido, y sin embargo no estaba allí! 
Devolvamos ahora a Bergman sus sonidos y a Tati su imagen, y todo recupera su 
lugar. La mano clavada hiere la vista, el niño modela sus rostros, los veraneantes tienen un 
aspecto cómico y unos ruidos que no oíamos demasiado, cuando sólo existía el sonido, 
surgen de la imagen como bocadillos de tiras dibujadas. 
Sólo que, ahora, hemos leído y oído de otro modo. El cine, arte de la imagen: ¿una 
ilusión? Ciertamente, ¿qué otra cosa puede ser en cualquier caso? Y de eso es, desde 
luego, de lo que habla este libro: de la ilusión audiovisual. 
Una ilusión que se encuentra, para empezar, en el corazón de la más importante de 
las relaciones entre sonido e imagen: la del valor añadido (ilustrada más arriba por 
Bergman). 
II. EL VALOR AÑADIDO: DEFINICIÓN 
Por valor añadido designamos el valor expresivo e informativo con el que un sonido 
enriquece una imagen dada, hasta hacer creer, en la impresión inmediata que de ella se 
tiene o el recuerdo que de ella se conserva, que esta información o esta expresión se 
desprende de modo «natural» de lo que se ve, y está ya contenida en la sola imagen. Y 
hasta procurar la impresión, eminentemente injusta, de que el sonido es inútil, y que 
reduplica la función de un sentido que en realidad aporta y crea, sea íntegramente, sea por 
su diferencia misma con respecto a lo que se ve. 
 Este fenómeno del valor añadido funciona sobre todo en el marco del sincronismo 
sonido / imagen por el principio de la síncresis (véase el capítulo 3), que permite establecer 
una relación inmediata y necesaria entre algo que se ve y algo que se oye. 
 En particular, todo lo que en la pantalla es choque, caída, explosión más o menos 
simulados o realizados con materiales poco resistentes, adquiere por medio del sonido una 
consistencia, una materialidad imponentes. Pero en primer lugar, en el nivel más primitivo, 
el valor añadido es el del texto sobre la imagen. ¿Por qué hablar ante todo del texto? Porque 
el cine es vococentrista, y con mayor precisión, verbocentrista. 
 
llI. VALOR AÑADIDO POR EL TEXTO 
llI.1. Vococentrismo y verbocentrismo del cine 
 Formular que el sonido en el cine es mayoritariamente vococentrista es recordar que 
en casi todos los casos favorece a la voz, la pone en evidencia y la destaca de entre los 
demás sonidos. La voz es lo que recoge, en el rodaje, la toma de sonido, que es casi 
siempre, de hecho, una toma de voz; y la voz es lo que se aísla en la mezcla como 
instrumento solista del que los demás sonidos, músicas o ruidos, no serían sino el 
acompañamiento. 
 Igualmente, lo esencial del perfeccionamiento tecnológico aportado a la toma de 
sonido en los rodajes (invención de nuevos micros y de nuevos sistemas de registro) se ha 
concentrado palabra. 
 Pues, por supuesto, no se trata de la voz de los gritos y de los gemidos, sino de la voz 
como soporte de la expresión verbal. Y lo que se persigue obtener al registrarla no es tanto 
la fidelidad acústica a su timbre original como la garantía de una inteligibilidad sin esfuerzo 
de las palabras pronunciadas. El vococentrismo del que hablamos es, pues, casi siempre, 
un verbocentrismo. 
 Pero si el sonido en el cine es voco y verbocentiista, es ante, todo porque el ser 
humano, en su conducta y sus reacciones cotidianas, también lo es. Si en cualquier ruido 
cercano procedente de su ambiente oye unas voces en medio de otros sonidos (ruido del 
viento, música, vehículos, son esas voces as que captan y centran en primer lugar su 
atención. Seguidamente, en rigor, si las conoce y sabe muy bien quién habla y lo que 
aquello quiere decir, podrá apartarse de ellas para interesarse por el resto. 
Si estas voces hablan en una lengua que le es accesible, buscará primero el sentido 
de las palabras, sin pasar a la interpretación de los demás elementos hasta que esté 
saturado su interés por el sentido. 
 
llI.2 El texto estructura la visión 
Hay un ejemplo elocuente que utilizamos a menudo en nuestras clases para 
demostrar el valor añadido por el texto, y que está tomado de una emisión televisada 
difundida en 1984. Se ve en ella una exhibición aérea que tiene lugar en Inglaterra y que 
comenta desde un estudio francés el locutor Léon Zitrone. Visiblemente desconcertado ante 
aquellas imágenes que le llegan en desorden, el valeroso presentador hace su oficio, sin 
embargo, lo mejor que puede. En un momento dado, afirma «Son tres pequeños aviones» 
ante una imagen en la que vemos, desde luego, tres pequeños aviones sobre un fondo de 
cielo azul, y la enormidad de la redundancia no deja nunca de provocar la risa. 
Sólo que Zitrone habría podido decir igualmente: «Hoy el tiempo es magnífico», y eso 
es precisamente lo que se hubiera reflejado en la imagen, en la cual, en efecto, no era 
visible nube alguna. O bien: «Los dos primeros aviones llevan ventaja sobre e/ tercero» y 
todo el mundo podría verlo entonces. O incluso: «¿Adónde ha ido a parar e/ cuarto?», y la 
ausencia de este último avión, salido del sombrero de Zitrone por el puro poder del Verbo, 
habría resultado evidente. El comentador, en suma, tenía otras cincuenta cosas que decir, 
igualmente «redundantes», pero de una redundancia ilusoria, puesto que en cada ocasión, 
estas cosas habrían guiado y estructurado de manera tan eficaz nuestra visión que las 
habríamos visto allí de modo «natural». 
La debilidad y los límites de la célebre demostración -ya criticada por Pascal Bonitzer 
en otro sentido- que Chris Marker quiso hace en su documental Lettre de Sibérie, cuando 
superpuso a una misma y anodina secuencia varios comentarios de inspiración política 
diferente(estalinista, antiestalinista, etc.), consiste en que hace creer -con sus exagerados 
ejemplos- que allí no hay sino una cuestión de ideología y que, aparte de eso, sólo existe 
una manera neutra de hablar. 
 Ahora bien, el valor añadido del texto sobre la imagen va mucho más allá de una 
opinión incrustada en una visión (sería fácil contradecirlo), ya lo que se refiere es a la 
estructuración misma de la visión, enmarcándola rigurosamente. En todo caso, la visión de 
la imagen cinematográfica, fugitiva y pasajera, no se nos da a explorar según nuestro ritmo, 
contrariamente a un cuadro en una pared o una fotografía en un libro, cuyo tiempo de 
exploración determinamos nosotros mismos, de modo que nos es más fácil verlos 
separándolos de su leyenda, de su comentario. 
 Así, si la imagen cinematográfica o televisiva parece hablar por sí misma, de hecho es una 
palabra... de ventrílocuo. y cuando el plano de los tres pequeños aviones en un cielo puro 
dice «Tres pequeños aviones», es una marioneta animada por la voz del comentador . 
 
IV. VALOR AÑADIDO POR LA MÚSICA 
 IV.I. Efecto empático y anempático 
 Como ya quedó dicho en Le Son au cinéma, para la música hay dos modos de crear 
en el cine una emoción específica, en relación con la situación mostrada. 
 En uno, la música expresa directamente su participación en la emoción de la escena, 
adaptando el ritmo, el tono y el fraseo, yeso, evidentemente, en función de códigos 
culturales de la tristeza, de la alegría, de la emoción y del movimiento. Podemos hablar 
entonces de música empatía (de la palabra empatía: facultad de experimentar los 
sentimientos de los demás). 
 En el otro, muestra por el contrario una indiferencia ostensible ante la situación, 
progresando de manera regular, impávida e ineluctable, como un texto escrito. y sobre el 
fondo mismo de esta «indiferencia» se desarrolla la escena, lo que tiene por efecto, no la 
congelación de la emoción sino, por el contrario, su intensificación, su inscripción en un 
fondo cósmico. De este último caso, que puede denominarse anempático (con una «a» 
privativa), se derivan en especial las innumerables músicas de organillo, de celesta, de caja 
de música y de orquesta de baile, cuya frivolidad e ingenuidad estudiadas refuerzan en las 
películas la emoción individual de los personajes y del espectador en la medida misma en 
que fingen ignorarla. 
 Este efecto de indiferencia cósmica se utilizaba ya sin duda en la ópera, aquí y allá, 
cuando la emoción era tan fuerte que helaba las reacciones de los personajes y provocaba 
en ellos una especie de regresión psicótica: el famoso efecto de locura, la musiquilla idiota 
que se repite como meciéndose, etc. Pero en la pantalla, este efecto anempático ha 
adquirido tal importancia que impulsa a creerlo íntimamente relacionado con la esencia del 
cine: su mecánica oculta. 
 Toda película procede, en efecto, de un fluir indiferente y automático, el de la 
proyección, que provoca en la pantalla y en los altavoces simulacros de movimientos y de 
vida, y este fluir debe ocultarse y olvidarse. ¿Qué hace la música anempática, sino develar 
su verdad, su aspecto robótico? Ella es la que hace surgir la trama mecánica de esta 
tapicería emocional y sensorial. 
 Hay también, finalmente, músicas que no son ni empáticas ni anempáticas, que 
tienen o bien un sentido abstracto, o una simple función de presencia, un valor de poste 
indicador y, en todo caso, sin resonancia emocional precisa. 
IV.2. Ruidos anempáticos 
 El efecto anempático, la mayoría de las veces, concierne ala música, pero puede 
utilizarse también con ruidos: cuando por ejemplo, en una escena muy violenta o tras la 
muerte de un personaje, sigue desarrollándose un proceso cualquiera (ruido de una 
máquina, zumbido de un ventilador, chorro de una ducha, etc.), como si no pasara nada, por 
ejemplo en Psicosis, de Hitchcock, o en El reportero, de Antonioni.. 
 
 
V. INFLUENCIAS DEL SONIDO EN LAS PERCEPCIONES 
DEL MOVIMIENTO y LA VELOCIDAD 
 
V .1. El sonido es movimiento 
 Comparadas una con otra, las percepciones sonora y visual son de naturaleza mucho 
más dispar de lo que se imagina. Si no se tiene sino una ligera conciencia de ello es porque, 
en el contrato audiovisual, estas percepciones se influyen mutuamente, y se prestan la una a 
la otra, por contaminación y proyección, sus propiedades respectivas. 
 
 Ante todo, la relación de estas dos percepciones con el movimiento y con la 
inmovilidad es siempre fundamentalmente diferente, puesto que el sonido supone de 
entrada movimiento, contrariamente a lo visual. 
 En una imagen cinematográfica en la que normalmente se mueven ciertas cosas, 
muchas otras pueden permanecer fijas. El sonido, por su parte, implica forzosamente por 
naturaleza un desplazamiento, siquiera mínimo, una agitación. Tiene sin embargo la 
capacidad de sugerir la fijeza pero en casos limitados. 
 En el caso límite, el sonido inmóvil es el que no presenta variación alguna en su 
desarrollo, particularidad que no se encuentra sino en algunos sonidos de origen artificial: la 
tonalidad de un teléfono o el ruido de fondo de un amplificador sonoro. Algunos torrentes y 
cascadas crean también a veces un rumor cercano al ruido blanco, pero es muy raro que en 
él no esté presente algún indicio de irregularidad y de movimiento. Puede crearse 
igualmente el efecto de un sonido fijo, pero con un sentido diferente, por medio de una 
variación o una evolución indefinidamente repetida tal cual, como «en bucle». 
 Huella de un movimiento o de un trayecto, el sonido tiene, pues, una dinámica 
temporal propia. 
 
V.2. Diferencia de velocidad perceptiva 
 A priori, las percepciones sonora y visual tienen cada una su ritmo medio propio: el 
oído, grosso modo, trabaja y sintetiza más deprisa que la vista. Tomemos un movimiento 
precipitado -un gesto de la mano- y comparémoslo con un trayecto sonoro brusco de la 
misma duración. El movimiento visual brusco no formará una figura nítida, no será 
memorizado un trayecto preciso: En el mismo tiempo, el trayecto sonoro podrá dibujar una 
forma nítida y consolidada, individualizada, reconocible entre todas. 
 No es un problema de atención: por mucho que revisemos diez veces el plano del 
movimiento visual y lo consideremos atentamente (por ejemplo, un gesto complicado 
realizado por un personaje con el brazo), seguirá sin dibujar una figura clara. Repitamos 
diez veces la audición de un trayecto sonoro brusco: su percepción se afirma, se impone 
cada vez mejor. 
 Hay varias razones para esto: ante todo, para los oyentes, el sonido es el vehículo del 
lenguaje, y una frase hace bajar al oído muy deprisa (comparativamente, la lectura con la 
vista es sensiblemente más lenta, salvo entrenamiento especial: en los sordos, por ejemplo). 
 Por otra parte, si la vista es más lenta, es porque tiene más que hacer: trabaja a la 
vez en el espacio, que explora, y en el tiempo, al que sigue. Se ve, pues, pronto superada 
cuando ha de asumir los dos. El oído, por su parte, aísla una línea, un punto, de su campo 
de escucha, y sigue en el tiempo este punto, esta línea. (Pero si se trata de una partitura 
musical familiar al oyente, la escucha de éste deja más fácilmente el hilo temporal para 
pasearse espacialmente.) Grosso modo: en un primer contacto con un mensaje audiovisual, 
la vista es, pues, más hábil espacialmente y el oído temporalmente. 
V.3. Consecuencias: movimientos visuales puntuados o creados como una ilusión 
por el sonido 
 Durante la audiovisión de una película sonora, estas diferencias de velocidad en el 
análisis no son percibidas como tales por el espectador en la medida en que interviene el 
valor añadido. 
 ¿Por qué, por ejemplo, los movimientos visuales rápidos que acumulan las películas 
de Kung-Fu o de efectos especiales no crean una impresión confusa? Puesporque son 
ayudados y «puntuados» por medio de puntuaciones sonoras rápidas (silbidos, gritos, 
choques y tintineos) que marcan perceptivamente ciertos momentos e imprimen en la 
memoria una huella audiovisual fuerte. 
 El cine mudo, sin embargo, ya tenía cierta predilección por los montajes de sucesos 
rápidos: observemos, no obstante, que, en este tipo de secuencia, procuraba simplificar la 
imagen hasta d el máximo, es decir, limitar la percepción espacial y exploratoria, o, para 
facilitar la percepción temporal. Esto implicaba una visión, altamente estilizada, análoga aun 
croquis. Buen ejemplo de ello es la secuencia de la desnatadora de La línea general, de 
Eisenstein, con sus primeros planos. 
 Si el cine sonoro, por su parte, puede utilizar a menudo movimientos complejos y 
fugitivos producidos en el seno de un marco ~~ visual saturado de personajes y de detalles, 
es porque el sonido sobreimpresionado en la imagen es susceptible de puntuar y des-tacar 
en ésta un trayecto visual particular. No sin un posible efecto de ilusionismo: cuando el 
sonido consigue hacer ver, articulado en la imagen, un movimiento rápido ¡ qué no está en 
ella! 
 Es el ejemplo, muy elocuente, del trabajo del encarado de sonido Ben Burtt sobre la 
saga de La guerra de las galaxias: había éste fabricado, como efecto sonoro para una 
apertura automática de puerta (se trata de esas puertas automáticas romboidales o 
hexagonales de las películas de ciencia ficción), un sonido sibilante y neumático, muy 
dinámico y convincente. Tan convincente que, en varias ocasiones, el realizador Irving 
Kershner, cuando rodó El imperio contraataca, y al tener que rodar un efecto de cierre de 
puerta, pudo limitarse a encadenar un plano de la puerta cerrada con un plano de la misma 
abierta. En el montaje, con el «pschhtt» de Ben Burtt, el espectador, que no tenía a la vista 
sino un encadenado cut, veía deslizarse la puerta! El valor añadido funcionaba aquí 
plenamente, a partir de un fenómeno propio del cine sonoro, y que podría llamarse el más-
rápido-que-la-vista. 
Está comprobado que los sordos formados en el lenguaje gestual desarrollan una 
capacidad particular de leer y de estructurar los fenómenos visuales rápidos. Esto plantea la 
cuestión de saber si, en este caso, no movilizan las mismas áreas cerebrales que las 
empleadas para el sonido por quienes no son sordos: uno de los numerosos hechos que 
llevan a cuestionar nuestras ideas previas sobre la separación de las categorías del sonido y 
de la imagen. 
 
V.4. Las almenas temporales del oído 
 Por otra parte, decir que la escucha funciona «al hilo del tiempo» es una fórmula que 
precisa ciertas correcciones. De hecho, el oído escucha por tramos breves, y lo que por él 
se percibe y memoriza consiste ya en breves síntesis de dos a tres segundos de la 
evolución del sonido, formando Gestalt globales. 
 Sólo que, en el interior de esos dos a tres segundos percibidos como una forma de 
conjunto, el oído (en realidad, el sistema oído- cerebro) ha realizado cuidadosa y seriamente 
su trabajo de en- cuesta, de manera que su informe global del suceso, formulado 
periódicamente, está repleto de detalles precisos y característicos tomados in situ. 
Llegamos entonces a esta paradoja: no oímos los sonidos -en el sentido de 
reconocerlos- hasta algo después de haberlos percibido. Si palmeamos breve y secamente, 
y escuchamos el ruido que esto provoca, la escucha -de hecho la aprehensión sintética de ¡ 
un pequeño fragmento de la historia sonora depositado en la memoria- seguirá muy de 
cerca al suceso: no será totalmente simultánea. 
 
 
VI. INFLUENCIA DEL SONIDO SOBRE LA PERCEPCIÓN 
DEL TIEMPO EN LA IMAGEN 
VI.I. Los tres aspectos de la temporalización 
 Entre los diferentes efectos del valor añadido, uno de los más importantes se refiere a 
la percepción del tiempo de la imagen, susceptible de verse considerablemente influido por 
el sonido. Un ejemplo extremo de ello se encuentra, como se ha visto, en el prólogo de 
Persona, en el que unas imágenes fijas desprovistas de toda temporalidad se inscriben en 
un tiempo real por unos sonidos de goteo de agua y de ruidos de pasos. 
 Este efecto de temporalización tiene tres aspectos: 
 
 - animación temporal de la imagen: la percepción del tiempo de la imagen se 
hace por el sonido más o menos fina, detallada, inmediata, concreta o, por el contrario, 
vaga, flotante y amplia. 
 
 - linealización temporal de los planos que, en el cine mudo, no siempre 
corresponden a una duración lineal en la que el contenido del plano 2 seguiría 
obligatoriamente a lo que muestra el plano 1, y así sucesivamente. Mientras que el sonido 
síncrono, por su parte, impone una idea de sucesión. 
 
 - vectorización o, dicho de otro modo, dramatización de los planos, orientación 
hacia un futuro, un objetivo, y creación de un sentimiento de inminencia y de expectación. El 
plano va a alguna parte y está orientado en el tiempo. Este efecto es localizable en su forma 
pura en el prólogo de Persona (el plano 1, por ejemplo). 
 
VI.2. Condiciones para una temporalización de las imágenes por el sonido 
 Estos tres efectos dependen, para ser actualizados, de la naturaleza de las imágenes 
y de los sonidos relacionados. 
Primer caso: la imagen no tiene por sí misma animación temporal ni 
vectorización alguna. Es el caso de una imagen fija, o cuyo movimiento sólo es una 
fluctuación global que no deja esperar resolución alguna: por ejemplo, un reflejo en el agua. 
En este caso, el sonido es susceptible de conducir esta imagen a una temporalidad que él 
mismo introduce de principio a fin. 
Segundo caso: la imagen implica una animación temporal propia (desplazamiento 
de personajes o de objetos, movimientos de humos, de luces, variación de encuadre). La 
temporalidad del sonido se combina entonces con la ya existente de la imagen: sea para ir 
en el mismo sentido, sea para contrariarla ligeramente, como dos instrumentos que suenan 
simultáneamente. 
 La temporalización depende también del tipo de sonidos. Según su densidad, su 
textura interna, su aspecto y su desarrollo, un sonido puede temporalmente animar una 
imagen en mayor o menor grado, aun ritmo más o menos jadeante y opresivo. Aquí entran 
en juego diferentes factores: 
 - naturaleza del mantenimiento del sonido: un sonido mantenido de modo liso y 
continuo es menos «animador» que un sonido sostenido de modo accidentado y trepidante. 
Si se intenta alternativamente, para acompañar a una misma imagen, una nota tenue y 
prolongada de violín y después la misma nota ejecutada en trémolo con punteados de arco, 
la segunda creará en la imagen una atención más tensa e inmediata que la primera. 
- previsibilidad o imprevisibilidad de la progresión sonora: una cadencia en el 
sonido modulada con regularidad, como un bajo continuo de música, o un tic-tac mecánico, 
y por tanto previsible, tiende a crear una animación temporal menor que un sonido de 
progresión irregular y, por ello, imprevisible, que pone en constante alerta el oído y el 
conjunto de la atención. Las gotas de agua de Persona, o las que Tarkovski gusta de hacer 
oír en sus películas, son ejemplo de ello: fijan la atención por su ritmo fina o fuertemente 
desigual. 
 Pero un ritmo demasiado regularmente cíclico puede crear también un efecto de tensión, 
porque esta regularidad mecánica nos mantiene expectantes ante la posibilidad de una 
fluctuación. 
 - papel del tempo: la animación temporal de la imagen por el sonido no es una 
cuestión mecánica de lempo; una música más rápida no acelera forzosamente la percepción 
de la imagen. La temporalización, a decir verdad, depende más de la regularidad o 
irregularidad del flujo sonoro que del lempo en el sentido musical de la palabra. Por ejemplo, 
si el flujo de las notas de la música es inestable pero de ritmo moderado, la animación 
temporal será mayorque si el ritmo es rápido pero regular. 
 - Definición del sonido: un sonido rico en frecuencias agudas creará una percepción 
más alerta, lo que explica que en muchas películas recientes el espectador se mantenga en 
tensión. 
La temporalización depende también del modelo de integración entre sonido e 
imagen, y de la distribución de los puntos de sincronización (véase más abajo). 
También aquí el sonido activa más o menos una imagen según introduzca puntos de 
sincronización más o menos previsibles o imprevisibles, variados o monótonos. De una 
manera general, la anticipación controlada es un factor poderoso de temporalización. 
 Para que el sonido influya temporalmente en la imagen, se necesitan en resumen un 
mínimo de condiciones. Es preciso, en primer lugar, que la imagen se preste a ello, ya por 
su fijeza y su receptividad pasiva (caso de las imágenes fijas de Persona), ya por su propia 
actividad (microrritmos «temporizables» por el sonido), es decir, en ese caso, que implique 
un mínimo de elementos de estructura, de concordancia, de encuentro y de simpa- tía (como 
se dice de las vibraciones), o de antipatía activa hacia el flujo sonoro. 
 Los microrritmos visuales de los que acabamos de hablar son movimientos rápidos en 
la superficie de la imagen, causados por cosas tales como volutas de humo, lluvia, copos, 
ondulaciones de la superficie rizada de un lago, arena, etc. , y en último grado, por el 
hormigueo del grano fotográfico mismo cuando es aparente. Estos fenómenos crean valores 
rítmicos rápidos y fluidos, instaurando en la imagen misma una temporalidad vibrante, 
estremecida. Kurosawa los emplea sistemáticamente en su película Dreams (lluvia de 
pétalos de árboles en flor, de copos en una tormenta de nieve, de niebla, etc.), y a Hans-
Jürgen Syberberg le gusta instalar también, en sus larguísimos planos fijos y sostenidos, 
microrritmos visuales (fumígenos en Hitler, llama vacilante de una vela en la lectura del 
monólogo de Molly Bloom por Edith Clever, etc.), yeso para afirmar la duración propia del 
cine sonoro en cuanto grabación de la microestructura del presente. 
VI.3. El cine sonoro es una cronografía 
 Hay que recordar, en efecto, un aspecto histórico oculto hasta hoy: es al sonido 
síncrono al que debemos el haber hecho del cine un arte del tiempo. La estabilización de la 
velocidad de paso de la película, convertida en necesaria por el sonoro, ha tenido 
ciertamente consecuencias mucho más allá de lo que podía preverse: a causa de ella, el 
tiempo fílmico se ha convertido, no ya en un valor elástico más o menos transportable según 
el ritmo de la proyección, sino en un valor absoluto. Desde entonces se estaba ya seguro de 
que lo que tenía tal duración en el montaje, conservaría en la proyección esa misma 
duración exacta, lo que no era el caso en el cine mudo. Los planos del cine mudo, por su 
parte, no tenían duración interna exacta, vibración temporal fija, al dejar a cada empresario o 
al proyeccionista cierto margen para el ritmo de flujo de la película. No es casual tampoco 
que la mesa de montaje con un motor que controla y regulariza la velocidad de flujo de la 
película no apareciera sino con el sonoro. 
 Atención: hablamos aquí del ritmo de la película terminada, en el interior de la cual 
pueden introducirse perfectamente planos trucados en la filmación, acelerados o 
ralentizados, como hicieron en diferentes épocas del cine sonoro un Michael Powell, un 
Scorsese, un Peckinpah o un Fellini. Sólo que, si la velocidad de esos planos no reproduce 
forzosamente la velocidad real con la que los actores actuaron en el rodaje, sí que se fija en 
todo caso en el tiempo de la película con un valor preciso, determinado y controlado. 
 El sonido, pues, ha temporalizado la imagen no sólo por el efecto del valor añadido, 
sino también, sencillamente, imponiendo una normalización y una estabilización de la 
velocidad de flujo de la película. Un Tarkovski mudo no habría sido concebible; y lo que el 
realizador ruso decía del cine, que es el «arte de esculpir en el tiempo», no habría podido 
decirlo, ni sobre todo hacer- 10, en la época del cine mudo, él, que ilustraba sus largos 
planos con estremecimientos, sobresaltos y apariciones fugitivas, combinados con amplias 
evoluciones controladas, en una estructura temporal hipersensible. El cine sonoro puede 
llamarse, pues, «crono- gráfico». 
 
VI.4. Linealización temporal 
 Cuando una sucesión de imágenes no prejuzga por sí misma el encadenamiento 
temporal de las acciones que ilustra (haciéndolas ver como capaces de ser tanto 
simultáneas como sucesivas), la superposición de un sonido realista y diegético impone a 
ésta i un tiempo real (es decir, contado según nuestra medida cotidiana) y sobre todo lineal, 
sucesivo. 
 Tomemos una escena, tal como se ven con frecuencia en el cine mudo, de reacción 
colectiva, construida como un montaje de primeros planos de rostros coléricos o divertidos: 
sin el sonido, no hay necesidad alguna de que los planos que se suceden en la pantalla 
designen acciones que se encadenen en la realidad. 
Pueden comprenderse muy bien las reacciones como simultáneas, y situarlas en un 
tiempo análogo al perfectivo. 
En cambio, aplicando a estas imágenes unos sonidos de abucheos o de risa 
colectiva, éstas se alinean como mágicamente en un tiempo lineal: el plano 2 muestra a 
alguien que ríe o increpa después del personaje del plano 1, y así sucesivamente. 
 De ahí procede el efecto «torpe» de ciertas escenas de reacción colectiva, en las 
primerísimas películas sonoras: por ejemplo, en el banquete inicial de La golfa, de Renoir, 
en la que el sonido (risas, conversaciones diversas entre convidados) aparece como 
superpuesto a unas imágenes concebidas según un tiempo aún no lineal. 
 La audición de la voz hablada tiene especialmente, en todo caso cuando se inscribe 
en el tiempo diegético y se sincroniza con la imagen, el poder de inscribir a ésta última en un 
tiempo real y linealizado que ya no tiene elasticidad. De ahí ese efecto, en un primer 
momento, de «tiempo cotidiano», que consternó, ala llegada del sonoro, a muchos cineastas 
del mudo. 
 La síncresis, de la que se hablará con más detalle en el capítulo 3, es un poderoso 
factor de linealización y de inscripción en un tiempo real. 
 
 VI.5. Vectorización del tiempo real 
 Imaginemos un apacible plano de alguna película exótica en el cual hay una mujer 
recostada en una mecedora, en un mirador, adormilada, y con su pecho elevándose con 
regularidad. La brisa agita los toldos y hace tintinear las campanillas de bambú colgadas 
cerca de la entrada. Las hojas de los plátanos se agitan al viento. Podemos muy bien 
proyectar este plano tan poético des- de la última a la primera imagen y nada esencial 
cambiará en él; todo parecerá ahora igualmente natural. Se dirá entonces que el tiempo del 
que es portador este plano es real, puesto que está lleno de microsucesos que reconstituyen 
la textura del presente, pero que no está vectorizado: entre el sentido del pasado hacia el 
futuro o del futuro hacia el pasado, no advertimos diferencia sensible alguna. 
 Tomemos ahora los sonidos con los que podría sonorizarse esta escena, sonidos 
grabados in situ, en directo, o que se han reconstituido después: la respiración de la mujer, 
el viento, el tintineo de las wood-chimes. Y pasemos de nuevo la película: nada encaja ya en 
absoluto, sobre todo el tintineo. ¿Por qué? Porque cada uno de estos entrechocamientos, 
constituido por un choque y una pequeña resonancia decreciente, es una historia acabada, 
orientada en el tiempo de una manera precisa e irreversible. Invertido, se advierte enseguida 
como «al revés». Los sonidos están vectorizados. Lo mismo en cuanto a las gotitas de agua 
del prólogo de Persona: la menor de ellas impone un tiempo real, irreversible, por- que 
presenta una curva orientada de cierta maneraen el tiempo (pequeño choque y resonancia 
muy fina) que concuerda con la lógica de la gravedad y del retorno a la inercia. 
Es la diferencia, en cine, entre el orden de lo sonoro y el de lo visual: a escala 
temporal comparable (pongamos de dos a tres segundos), los fenómenos sonoros están 
mucho más característicamente vectorizados en el tiempo -con un principio, un medio y un 
fin no reversibles- que los fenómenos visuales. 
 Si esto se nos escapa es porque el cine, en el plano visual, se ha entretenido muchas 
veces con las excepciones y las paradojas, jugando con lo irreversible visual: un objeto roto 
que recobra su forma a partir de sus trozos, un muro demolido que se reconstruye, o el 
inevitable gag del bañista que sale de la piscina con los pies hacia arriba y que vuelve de 
nuevo a su trampolín. Pero en casos cinematográficos muy frecuentes, un personaje que 
habla, sonríe, toca el piano..., ofrece una imagen periódica y reversible, en la que el sentido 
pasado-futuro no se marca como en el caso del sonido, que es por el contrario muchas 
veces una sucesión de pequeños fenómenos orientados todos en el tiempo: ¿no está la 
música de piano, por ejemplo, constituida por millares de pequeños indicios de tiempo real 
vectorizado, pues cada nota, apenas nacida, empieza a extinguirse?. 
 En cambio, una imagen que muestre acciones debidas a fuerzas no reversibles 
(caída de un objeto por efecto de la gravedad, explosión que dispersa fragmentos, etc.) está 
claramente vectorizada. 
 
VI..6. El estridor y el trémolo: carácter cultural o natural 1de esta influencia 
 La animación temporal de la imagen por el sonido no es un fenómeno puramente 
físico y mecánico: desempeñan también su papel códigos cinematográficos y culturales. Una 
música, o un efecto sonoro y vocal, que se perciban como culturalmente desplazados en el 
decorado, no harán vibrar la imagen. y sin embargo, el fenómeno tiene, en todo caso, una 
base no cultural. 
 Tomemos el ejemplo del trémolo de instrumentos de cuerda, procedimiento 
clásicamente empleado en la ópera y la música sin- fónica para crear un sentimiento de 
tensión dramática, de sus- pensión, de alerta. 
El cine es susceptible de utilizar igualmente, para el mismo resultado, una 
estridulación de insectos nocturnos, como por ejemplo en la escena final de Hijos de un dios 
menor, de Randa Haines. Ese sonido ambiental no está sin embargo explícitamente 
codificado en ese sentido; no es un procedimiento de escritura oficialmente inventariado, ya 
pesar de esto puede tener sobre la percepción dramática del tiempo exactamente la misma 
propiedad que tiene el trémolo orquestal: concentrar la atención y hacernos sensibles a la 
menor vibración en la pantalla. Los encarga- dos de sonido y los mezcladores utilizan 
además con frecuencia tales ambientes nocturnos, y dosifican su efecto como directores de 
orquesta, mediante la elección de ciertas grabaciones y por el modo de mezclarlas para 
crear un sonido global. Pues el efecto variará evidentemente según la densidad del estridor, 
su carácter más o menos regular fluctuante, y su duración, exactamente como para un 
efecto de orquesta. 
 Ahora bien, ¿qué hay de común, para el espectador de cine, entre un trémolo de 
cuerdas en una orquesta, que él localiza como procedimiento musical cultural, y un ruido 
animal, que percibe como una emanación natural del decorado en el que se sitúa la acción, 
sin considerar ni siquiera durante un segundo que éste haya podido grabarse 
independientemente de la imagen y recomponer- se cuidadosamente? Sólo una identidad 
acústica: la de una vibración aguda, ligera y sutilmente desigual, que alerta al tiempo que 
fascina. Parece, pues, que estamos ante un efecto universal y espontáneo. Efecto frágil, sin 
embargo, y que cualquier detalle -una mezcla de sonido deficiente, una pérdida de confianza 
por parte del espectador en el contrato audiovisual, debido aun defecto de realización, de 
interpretación del guión- basta para comprometer. 
 Así sucede, por otra parte, con todos los efectos de valor añadido, que nada tienen de 
mecánico: fundados en una base psicofisiológica, no operan sino en ciertas condiciones 
culturales, estéticas y afectivas, por una interreacción de todos los elementos. 
 
VIl. EJEMPLO DE RECIPROCIDAD DEL VALOR AÑADlDO: 
LOS SONIDOS DE LO HORRIBLE 
 El valor añadido es recíproco: si el sonido hace ver la imagen de modo diferente a lo 
que esta imagen muestra sin él, la imagen, por su parte, hace oír el sonido de modo distinto 
a como éste resonaría en la oscuridad. Sin embargo, a través de esa doble ida-y-vuelta, la 
pantalla sigue siendo el principal soporte de esta percepción. El sonido transformado por la 
imagen sobre la que influye reproyecta finalmente sobre ésta el producto de sus influencias 
mutuas. 
 El caso de los sonidos horribles o impresionantes, sobre los cuales la imagen 
proyecta por sugestión un sentido que ellos no poseen en modo alguno, es el ejemplo de 
esta reciprocidad. 
 Todo el mundo sabe, en efecto, que el cine sonoro clásico, en el que se evitaba 
mostrar ciertas cosas, acudía al sonido en ayuda de su tabú visual para sugerir el 
espectáculo de una manera mucho más impresionante que si se hubiese tenido ante la 
vista. El ejemplo arquetípico de ello se encuentra al principio de la obra maestra de Aldrich 
El beso mortal, cuando la fugitiva ala que Ralph Meeker ha recogido en autostop es 
atrapada por sus perseguidores y sometida a tortura: de esta tortura el espectador no ve 
sino dos piernas desnudas que forcejean, mientras que oye los gritos de la desdichada. He 
aquí, se dirá, un efecto típicamente sonoro. Ciertamente, pero a condición de precisar que lo 
que hace tan aterradores los gritos no es su propia realidad acústica, sino lo que la situación 
narrada y lo que se deja entrever inducen a proyectar sobre ellos. 
 Buscando otro efecto sonoro traumático procedente de una película, se impone el 
ejemplo de una escena de La pie/, de Liliana Cavani (según Malaparte), en la que un tanque 
americano aplasta accidentalmente aun muchacho italiano, con un ruido espantoso, que 
evoca una sandía aplastada, si debemos dar crédito al recuerdo. El espectador pocas veces 
habrá oído el ruido real de un cuerpo humano así tratado, pero puede imaginar que el 
acontecimiento tendrá también algo de húmedo y viscoso. Por otra, parte, es evidente que el 
sonido de la película de Cavani ha sido, elaborado con un truco de sonido, acaso, 
justamente, aplastando una fruta. 
 Más tarde veremos que el valor figurativo, narrativo, de un ruido reducido a sí mismo 
es muy impreciso. Un mismo sonido puede, pues, según el contexto dramático y visual, 
contar cosas muy distintas, puesto que, para el espectador de cine, más que el realismo 
acústico, es el criterio de sincronismo ante todo, y secundariamente de verosimilitud global 
(una verosimilitud que es asunto no de verdad, sino de convención), el que lo llevará a 
superponer un sonido a un suceso o un fenómeno. El mismo sonido podrá, pues, sonorizar 
de manera convincente en una comedia la sandía que se aplasta y, en una película de 
guerra, el cráneo hecho papilla. Ese mismo ruido será en un sitio jubiloso, y en otro 
insoportable. 
 En Los ojos sin rostro, de Franju, se encuentra también uno de los pocos sonidos 
fílmicos realmente inquietantes que tanto el público como los críticos advirtieron y 
comentaron después: el de la caída del cadáver de una chica, espantoso residuo de un 
fracasado intento de trasplante, cuando el cirujano Pierre Brasseur lo deja caer en un foso, 
ayudado por su cómplice Alida Valli. Lo que de común tiene ese sonido sordo y denso, que 
nunca deja de hacer estremecerse al público, con el ruido citado más arriba de la película de 
Cavani, es que transforma al ser humano en cosa, en vil materia inerte y desechable, con 
sus cavidades óseas y su montónde entrañas. 
 Pero es también un ruido impresionante por su manera de re- presentar, en el ritmo 
de la escena y de la película, una interrupción de palabra, un momento en el que falta la 
palabra de los personajes, aquí los dos cómplices. Algunos ruidos sólo resuenan así, en el 
cine o en la vida, porque sobreviven en cierto lugar, en una cadena de lenguaje en la que 
forman un vacío. Atroz ilustración de esta idea: la escena de Andrei Rublev, de Tarkovski, en 
la que un príncipe ruso torturado por los tártaros sale cubierto de vendas, que ocultan su 
cuerpo mutilado y no dejan ya visibles más que los labios. Abandonado en un lecho, maldice 
a sus torturadores, pero, justamente después, la mano del verdugo trae un cazo lleno de 
aceite hirviendo que le es vertido en la garganta. El gesto se nos oculta por medio de la 
espalda del verdugo, misericordiosamente (o más bien hábilmente) interpuesta en ese 
momento entre el espectador y la cabeza del ajusticiado. No oímos más que un ruido de 
gargarismos espantoso que nos pone la carne de gallina. Sólo que, como en el caso del 
ruido del aplasta- miento anterior, podría ser el mismo ruido que haría Peter Sellers 
haciendo gárgaras en una comedia de Blake Edwards. 
 Aquí, el ruido alcanza esa intensidad porque representa la palabra humana afectada 
en su centro físico: se ha destruido una laringe, una lengua que acababa justamente de 
hablar. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
2. Las tres escuchas 
 
I. Primera Actitud de Escucha: La Escucha Causal 
 
I.1. Definición 
 Cuando hacemos hablar a alguien sobre lo que ha oído, sus respuestas suelen 
impresionarnos por el carácter heteróclito de los niveles en los que se sitúan. Y es que hay -
al menos- tres actitudes de escucha diferentes, que apuntan a tres objetos diferentes: la 
escucha causal, la escucha semántica y la escucha reducida. 
 La escucha más extendida es la primera, la escucha causal, la cual consiste en 
servirse del sonido para informarse, en lo posible, sobre su causa. Puede que esta causa 
sea visible y que el sonido pueda aportar sobre ella una información suplementaria, por 
ejemplo en el caso de un recipiente cerrado: el sonido que se produce al golpearlo nos dice 
si está vacío o lleno. O puede, a fortiori, que sea invisible y que el sonido constituya sobre 
ella nuestra principal fuente de información. La causa puede además ser invisible, pero 
identificada por un saber o una suputación lógica a: propósito de ella. También aquí, sobre 
este saber, trabaja la escucha causal, que pocas veces parte de cero. - No habría que 
ilusionarse, en efecto, acerca de la exactitud y de las posibilidades de la escucha causal, es 
decir, sobre su capacidad de proporcionarnos informaciones seguras y precisas a partir sólo 
del análisis del sonido. En realidad, esta escucha causal, que es la más extendida, es 
también la más susceptible de verse influida... y engañada. 
 
1.2. Naturaleza de la identificación causal 
 La escucha causal puede realizarse en diferentes niveles. Unas veces reconocemos 
la causa precisa e individual: la voz de una persona determinada, el sonido de un objeto 
único entre todos. 
 Pero este reconocimiento se hace pocas veces sólo a partir del sonido, fuera de todo 
contexto. Apenas hay nada, fuera del individuo humano, que emita, mediante su voz 
hablada, un sonido característico suyo y sólo suyo. En cambio, diferentes perros de la 
misma especie tienen el mismo ladrido. O en todo caso, lo que viene a ser lo mismo, no 
somos capaces de diferenciar el ladrido de un bulldog del de otro bulldog, o incluso del de 
un perro de raza semejante. Si se supone que loS perros son capaces de identificar entre 
cientos de voces la de su dueño, es muy dudoso que ese dueño pueda discernir entre todas, 
Con los ojos cerrados y sin informaciones suplementarias, la voz de su perro. 
Lo que disimula, en este caso, esta deficiencia de nuestra escucha causal es que, 
cuando estamos en casa y oímos ladrar en la habitación vecina, deducimos lógica y 
naturalmente que se trata de Toby o de Rolf. 
 Al mismo tiempo, una fuente reconocida no siempre puede nombrarse. Podemos muy 
bien escuchar todos los días a una locutora de radio cuyo físico y nombre ni siquiera 
conocemos; eso no nos impide en modo alguno abrir en nuestra memoria una ficha 
descriptiva vocal y personal de esta locutora, ficha en la cual dejamos temporalmente en 
blanco su nombre y otras características (color del pelo y rasgos de su rostro, que su voz, 
naturalmente, no delata). 
 Pues hay una gran diferencia entre lo que podría llamarse tomar nota del timbre de 
voz de un individuo, e identificar a éste, tener una imagen visual suya, memorizarla y darle 
un nombre. 
Segundo caso: no reconocemos un ejemplar, un individuo o un ítem único y 
particular, sino una categoría con causa humana, mecánica o animal: voz de un hombre 
adulto, motor de una Mobylette, canto de una alondra. 
 De modo más general, en casos aún más ambiguos -y mucho más numerosos de lo 
que se cree- lo que reconocemos es sólo una naturaleza de causa, la naturaleza misma del 
agente: «Debe de ser algo mecánico» (identificado por un ritmo, una regularidad justamente 
llamada mecánica); «Debe de ser algo animal, o algo humano», etc. Se localizan entonces, 
a falta de algo mejor, ciertos indicios, en especial temporales, de los que intentamos 
servirnos para deducir esta naturaleza de la causa. 
 También podemos, sin identificar la fuente en el sentido de la naturaleza del objeto 
causal, seguir con precisión la historia causal del propio sonido. Por ejemplo, conseguimos 
seguir la historia de un roce (acelerado, precipitado, ralentizado, etc.) y sentir cambios de 
presión, de velocidad y de amplitud, sin saber en modo alguno lo que roza y cómo lo roza. 
 
1.3. La fuente es un cohete de varios cuerpos 
 No hay que olvidar, finalmente, que un sonido no siempre tiene una fuente única, sino 
al menos dos, incluso tres o aún más. Tomemos el rasgueo del rotulador con el que se 
escribe el borrador de este texto; las dos fuentes del sonido son el rotulador y el papel, pero 
también el gesto de escribir y, además, nosotros que escribimos; y así sucesivamente. Si 
este sonido se graba y se escucha en un magnetófono, la fuente del sonido será también el 
altavoz, la banda magnética en la que se ha fijado el sonido, etc. 
 Observemos que, en el cine, la escucha causal es manipulada constantemente y por 
completo por el contrato audiovisual, y especialmente por la utilización de la síncresis. Se 
trata, en efecto, la mayoría de las veces, no de las causas iniciales de los sonidos, sino de 
causas en las que se nos hace creer. 
II. SEGUNDA ACTITUD DE ESCUCHA: LA ESCUCHA SEMÁNTICA 
 Llamamos escucha semántica a la que se refiere aun código o aun lenguaje para 
interpretar un mensaje: el lenguaje hablado, por supuesto, y también códigos tales como el 
morse. 
Esta escucha, de funcionamiento extremadamente complejo, es la que constituye el 
objeto de la investigación lingüística y ha sido mejor estudiada. Se ha observado, en 
particular, que es puramente diferencial. Un fonema no se escucha por su valor acústico 
absoluto, sino a través de todo un sistema de oposiciones y de diferencias. 
 De suerte que, en esta escucha, podrán pasar desapercibidas diferencias importantes 
de pronunciación, y por tanto de sonido, si no son pertinentes en el seno de una lengua 
dada. La escucha lingüística en francés es insensible por ejemplo a ciertas variaciones 
importantes en la pronunciación del fonema «a». 
 Desde luego, la escucha causal y la escucha semántica pueden ejercitarse paralela e 
independientemente en una misma cadena sonora. Oímos a la vez lo que alguien nos dice, 
y cómo lo dice. En cierto modo, la escucha causal de una voz, por otra parte, es a su 
escucha lingüística lo que la percepción grafológica de un textoescrito es a su lectura. 
Hay que precisar que la investigación lingüística ha intentado distinguir y articular 
percepción del sentido y percepción del sonido, estableciendo una diferencia entre fonética, 
fonología y semántica. 
III. TERCERA ACTITUD DE ESCUCHA: LA ESCUCHA REDUCIDA 
III.1. Definición 
Pierre Schaeffer ha bautizado como escucha reducida a la escucha que afecta a las 
cualidades y las formas propias del sonido, independientemente de su causa y de su 
sentido, y que toma el sonido -verbal, instrumental, anecdótico o cualquier otro- como objeto 
de observación, en lugar de atravesarlo buscando otra cosa a través de él (el calificativo 
«reducida» se ha tomado de la noción fenomenológica de reducción en Husserl). 
 Una sesión de escucha reducida es una experiencia muy instructiva: los participantes 
acaban advirtiendo en ella que tenían la costumbre, al hablar de los sonidos, de realizar un 
vaivén constante de la materia de esos sonidos a su causa ya su sentido. Se dan cuenta de 
que hablar de los sonidos por sí mismos, limitándose a calificarlos independientemente de 
toda causa, sentido o efecto, no es empresa menor. Y las palabras analógicas habituales 
revelan aquí toda su ambigüedad: tal sonido es chirriante, decimos, pero, ¿en qué sentido? 
Chirriante, ¿es sólo una imagen, o no es sino una remisión a una fuente que chirría? ¿O la 
evocación de un efecto desagradable?. 
 Se ven surgir entonces, ante esta dificultad de interesarse por los sonidos en sí, 
ciertos tipos de reacción específicos que son otras tantas defensas: sea la burla, la 
evocación de causas triviales o peregrinas, cacerolas o grifos. En otros, la huida ante la 
descripción se traduce en la pretensión de objetivar el sonido, recurriendo a máquinas tales 
como analizadores de espectro o cronómetros, los cuales no captan sino valores físicos y no 
designan lo que se oye. Una tercera actitud de repliegue consiste en atrincherarse tras un 
subjetivismo a ultranza: así, cada uno oiría una cosa distinta, y el sonido percibido seguiría 
siendo siempre irreconocible. Sin embargo, la percepción no es un fenómeno puramente 
individual, puesto que deriva de una objetividad particular, la de las percepciones 
compartidas. Y en esta subjetividad, nacida de una «intersubjetividad», es donde pretende 
situarse la escucha reducida, tal como Schaeffer la ha definido muy bien. 
 El inventario descriptivo de un sonido en la escucha reducida no puede contentarse 
con sólo una aprehensión. Se necesita reescuchar y, para eso, mantener el sonido fijo en un 
soporte. Pues un instrumentista o un cantante, interpretando ante nosotros, son incapaces 
de repetir todas las veces el mismo sonido: no pueden reproducir sino su altura y su perfil 
general, no las cualidades concretas que particularizan un suceso sonoro y lo hacen único. 
 La escucha reducida implica, pues, la fijación de los sonidos, los cuales acceden así 
al status de verdaderos objetos. 
 
 III.2. Exigencias de la escucha reducida 
 
 La escucha reducida es una gestión nueva, fecunda. ..y poco natural. Altera las 
costumbres y las perezas establecidas, y abre a quien la aborda un mundo de preguntas 
que antes ni siquiera imaginaba plantearse. Todo el mundo la practica un poco, pero de 
manera muy elemental: cuando situamos la altura de una nota o los intervalos entre dos 
sonidos hacemos escucha reducida sin saberlo, pues la altura es desde luego un carácter 
propio del sonido, independiente de la identificación de su causa o de la comprensión de su 
sentido. 
 El problema consiste en que un sonido no se define únicamente por una altura 
precisa, y que, tiene desde luego otros caracteres perceptivos. Y por otra parte, en que 
muchos sonidos cotidianos no tienen una altura precisa y observable, sin la cual la escucha 
reducida no sería nada distinto del apacible solfeo tradicional. 
¿Puede formularse algo descriptivo sobre los sonidos, haciendo, al mismo tiempo 
abstracción de su causa? Schaeffer ha mostrado que era posible, pero sólo pudo abrir el 
camino, proponiendo un sistema de clasificación en su Tratado de los objetos musicales, 
sistema que, ciertamente, no está terminado ni al abrigo de toda crítica, pero que tiene el 
inmenso mérito de existir. 
 Imposible, en efecto, desarrollar una escucha reducida si no se crean conceptos y 
criterios nuevos, ya que el lenguaje corriente, así como el lenguaje musical especializado, 
están totalmente desarmados ante algunos de esos rasgos sonoros que la escucha reducida 
de los sonidos fijados nos hace reconocer. 
 En este volumen no vamos a hacer un curso de escucha reducida y descripción 
sonora; sobre este tema, remitimos a los libros dedicados a la cuestión y, en especial, a 
nuestro propio resumen de los trabajos de Pierre Schaffer, publicado bajo el título de Cuide 
des Objets Sonores. 
 
III.3. ¿Para qué sirve la escucha reducida? 
 
 Pero, ¿para qué nos sirve la escucha reducida? , se preguntaban unos estudiantes a 
quienes habíamos hecho practicar intensamente durante cuatro días, y que aspiraban a una 
dedicación audiovisual. En efecto, si el cine y el vídeo emplean los sonidos, es, parece, sólo 
por su valor figurativo, semántico o evocador, en referencia a causas reales o sugeridas o a 
textos, pero pocas veces en cuanto formas y materias en sí. 
 No obstante, la escucha reducida tiene la inmensa ventaja de ampliar la escucha y de 
afinar el oído del realizador, del investigador y del técnico, que conocerán así el material de 
que se sirven y lo dominarán mejor. En efecto, el valor afectivo, emocional, físico y estético 
de un sonido está ligado no sólo a la explicación causal que le superponemos, sino también 
a sus cualidades propias de timbre y de textura, a su vibración. Paralelamente, en el plano 
visual, a un realizador o un operador-jefe les interesará muchísimo perfeccionar su 
conocimiento de la materia y de la textura visuales, incluso aunque nunca hagan películas 
abstractas. 
III.4. Acusmática y escucha reducida 
 La escucha reducida y la situación acusmática están en concordancia, pero de una 
manera más ambigua de lo que dejaba entender Pierre Schaeffer, a quien debemos el haber 
establecido estas dos nociones. 
 Schaeffer, en efecto, subrayaba hasta qué punto la situación de escucha acusmática, 
definida más abajo como aquella en la que se oye el sonido sin ver su causa, puede 
modificar nuestra escucha y atraer nuestra atención hacia caracteres sonoros que la visión 
simultánea de las causas nos enmascara, al reforzar la percepción de ciertos elementos del 
sonido y ocultar otros. La acusmática permite revelar realmente el sonido en todas sus 
dimensiones. 
 Al mismo tiempo, Schaeffer pensaba que la situación acusmática podía alentar por sí 
misma la escucha reducida, es decir, alejarse de las causas o de los efectos en beneficio de 
una localización consciente de las texturas, de las masas y de las velocidades r sonoras. 
Contrariamente, muchas veces, se produce lo inverso al menos en un primer momento, ya 
que la acusmática empieza por exacerbar la escucha causal privándola del socorro de la 
vista. Frente aun sonido que pasa por un altavoz y que no se presenta t con su tarjeta de 
visita visual, el oyente es inducido a plantearse con mucha más ansia la pregunta «¿Qué 
es?» (traducible por «¿Qué causa ese sonido?») y a acechar los menores indicios de 
identificación de la causa, a menudo interpretados por otra parte en sentido contrario. 
 En cambio, la escucha repetida de un mismo sonido, en la t escucha acusmática de 
los sonidos fijos, es la que nos permite separarnos gradualmente de su causa, y precisar 
mejor sus caracteres propios. 
 Paralelamente, gracias a sus correlaciones: ¿a partir de qué, en efecto, deducimos 
una causa sino a partir de la forma característica a la que obedece el sonido? El saber que 
es «el sonido de...»ya no presenta el riesgo de ocultar la pregunta: ¿qué sucede con el 
sonido mismo? 
IV. OÍR / ESCUCHAR y VER / MIRAR 
 Nos ha parecido importante plantear la distinción de las tres actitudes de escucha en 
el marco de este ensayo sobre la audiovisión, pero hay que recordar igualmente en qué 
contexto, variado y múltiple, se recubren entre sí y se combinan estas tres escuchas en el 
cine. 
 La cuestión de la escucha es inseparable del hecho de oír, igual que la de la mirada 
está ligada al ver. Dicho de otro modo, para describir los fenómenos perceptivos es 
obligatorio tener en cuenta que la percepción consciente y activa no es sino una elección en 
un dado más amplio que está ahí imponiendo su presencia. 
En el cine, la mirada es una exploración, espacial y temporal a la vez, en un dado a la 
vista delimitada que se mantiene en el marco de una pantalla. Mientras que la escucha, por 
su parte, es una exploración en un dado-al-oído e, incluso, un impuesto- a/-oído mucho 
menos delimitado en todos los aspectos, con unos contornos inciertos y cambiantes. 
 Por razón de hechos naturales conocidos de todos (la ausencia de párpados para las 
orejas, la omnidireccionalidad de la escucha, y la naturaleza física misma del sonido), pero 
también de una ausencia de verdadera cultura auditiva, este impuesto-al-oído es tal que 
difícilmente podemos excluir, seleccionar y cortar en él cosa alguna. En el sonido siempre 
hay algo que nos invade y nos sorprende, hagamos lo que hagamos. y que, incluso y sobre 
todo cuando nos negamos a prestarle nuestra atención consciente, se inmiscuye en nuestra 
percepción y produce en ella sus efectos. La percepción consciente puede, por supuesto, 
ejercitarse esforzadamente por someter todo a su control, pero, en la situación cultural 
actual, el sonido tiene, más fácilmente que la imagen, el poder de saturarla y cortocircuitarla. 
 Sus consecuencias, para el cine, son que el sonido es, más que la imagen, un medio 
insidioso de manipulación afectiva y semántica. Sea que el sonido actúe en nosotros 
fisiológicamente (ruidos de respiración); o sea que, por el valor añadido, interprete el sentido 
de la imagen, y nos haga ver en ella lo que sin él no veríamos o veríamos de otro modo. 
 Por eso, el sonido no se puede investir y localizar del mismo modo que la imagen. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
3. Líneas y puntos 
 
I. LA CUESTIÓN DE LO HORIZONTAL y DE LO VERTICAL 
 
1.1. ¿Armonía o contrapunto? 
 
Hacia finales de los años 20, justamente a la llegada del sonoro, que coincidió con un 
extraordinario impulso estético en el cine mudo, gustaba mucho hacer comparaciones entre 
cine y música. Por eso, cuando llegó el sonido, se lanzó la expresión, aún hoy en boga, de 
contrapunto, para designar la fórmula ideal in abstracto de cine sonoro: aquella en la que, 
lejos de resultar redundantes como se decía, sonido e imagen formarían dos cadenas 
paralelas y libremente enlazadas, sin, dependencia unilateral. 
 Recordemos que, en la terminología de la música clásica occidental, se llama 
contrapunto al modo de escritura que piensa las diferentes voces simultáneas como 
necesariamente seguidas cada una en su desarrollo horizontal, coordinado con el de las 
demás voces, pero individualizado; mientras que la armonía considera el punto de vista 
vertical, el de las relaciones de cada nota con las oídas en el mismo momento, que forman 
acordes todas juntas, y regula la conducta de las voces en relación con el logro de estos 
acordes verticales. El aprendizaje de la escritura musical clásica implica estas dos 
disciplinas y, de hecho, la mayor parte de las obras del repertorio occidental, a partir de 
cierto período, combinan más o menos en su escritura estas dos dimensiones, difíciles de 
disociar totalmente. 
 Un supuesto contrapunto audiovisual, ejercido en condiciones muy diferentes del 
contrapunto musical (puesto que este último funciona con el mismo material de notas, 
mientras que el sonido y la imagen pertenecen a categorías sensoriales diferentes), 
implicaría pues, si la comparación tiene sentido, que pudiera constituirse en el cine una «voz 
sonora», horízontalmente percibida como coordinada con la cadena visual, pero 
individualizada y diseñada por sí misma. 
 Lo que queremos demostrar aquí es que el cine, en su dinámica particular y por la 
naturaleza de sus elementos, tiende a excluir la posibilidad de ese funcionamiento horizontal 
y contrapuntístico. Es tal, por el contrarío, que las relaciones armónicas y verticales (sean 
consonantes, disonantes o ni-Io-uno-ni-Io-otro, a lo Debussy), es decir, específicamente, las 
relaciones entre un sonido dado y lo que sucede al mismo tiempo en la imagen, son en él 
más ampliamente impositivas. La aplicación al cine de la noción de contrapunto es, pues, un 
parche, resultante de una especulación intelectual, más que un concepto vivo. 
 Prueba de ello es que este paralelismo pronto se convirtió en un embrollo 
empleándose incluso en sentido contrario, y que muchos ejemplos presentados como 
modelos de contrapunto eran, en rigor, casos de armonía disonante, puesto que 
atestiguaban justamente una discordancia momentánea entre una imagen y un sonido, en 
relación con su naturaleza figurativa. Nosotros mismos, si bien vamos a utilizar la metáfora 
musical, no debemos engañarnos: el término armonía no da cuenta tampoco de la 
especificidad del fenómeno audiovisual. 
 Realmente, nuestra interrogación sobre el doble aspecto horizontal y vertical de la 
cadena audiovisual, a la que va a dedicarse todo este capítulo, pone de relieve su 
interdependencia y su dialéctica: por ejemplo, las películas en las que es posible una 
especie de libertad horízontal ejemplo típico de ellas es el videoclip, con sus cadenas 
paralelas de imágenes y de sonidos, sin relación precisa muchas veces- muestran al mismo 
tiempo una vigorosa solidaridad perceptiva, marcada por la disposición regular, de vez en 
cuando, de puntos de sincronización. Los cuales, para recurrir a la comparación clásica, dan 
el armazón armónico del sistema audiovisual. 
1.2. La disonancia audiovisual 
 El contrapunto audiovisual, llamado, interpelado, reclamado, sin cesar a voz en grito 
en el cine, puede encontrarse diariamente en la televisión, pero nadie parece advertirlo. Se 
produce en especial en retransmisiones de ciertos acontecimientos deportivos, cuando la 
imagen sigue un camino y el comentario otro. Hay un ejemplo al que nosotros recurrimos 
con frecuencia para evidenciarlo, y que está tomado de una secuencia del reportaje sobre 
una carrera ciclista en Barcelona: la imagen muestra a los corredores tomados desde un 
helicóptero y es totalmente muda. El sonido, por su parte, es un diálogo a través de las 
ondas entre los periodistas y unos corredores que no participan. Visiblemente, en este 
fragmento, los que hablan no miran las imágenes ni un segundo, y tampoco las comentan. 
Durante dos minutos, todo eso sigue caminos perfectamente divergentes y solamente la 
circunstancia ciclista da algún sentido a la cohabitación de esos dos universos. Y sin 
embargo, nadie a quien se da a ver este ejemplo observa nunca el contrapunto que reina en 
él. 
 ¿Por qué? Porque el contrapunto audiovisual no se advierte salvo si opone sonido e 
imagen sobre un punto preciso, no de naturaleza, sino de significación; es decir, si prejuzga 
la lectura que va a hacerse, tanto del sonido como de la imagen, al postular una cierta 
interpretación lineal del sentido de los sonidos, rebajando por otra parte ese «sentido», en 
general, a una pura cuestión de identificación y de causa. 
 Así, el problema del contrapunto-contradicción, o más bien de la disonancia 
audiovisual, tal como ha sido empleada y reivindicada en películas como L 'Homme qui 
ment, de Robbe-Orillet, con una partitura sonora de Michel Fano, es que

Continuar navegando