Existen muchos formatos de audio, pero para el DVD-Video las especificaciones establecidas en 1998 determinaron que debería tener un mínimo de 48 Khz (a diferencia del CD determinado en 44.1 Khz/16 bit) y un máximo de 96 Khz/24 bits o más de resolución. Para pocas personas, estos términos están claros, pero para la mayoría son conceptos muy vagos, así que intentaré explicar algo antes de continuar con otras palabras raras.
LAS CARACTERISTICAS DEL SONIDO
Cualquier sonido viaja en ondas longitudinales, pero estas ondas-vibraciones tienen 3 características principales: la primera es que las ondas-vibraciones se repiten y entonces es posible medir la frecuencia de ellas. A los humanos se nos ocurrió medir la vibración de las ondas por el número de veces que llegan a un punto-lugar en un segundo. Imagina que tecleamos la letra "A" cinco veces por segundo. Entonces diríamos que nuestra letra "A" tiene una frecuencia de 5 veces por segundo. Es igual con las ondas sonoras: la frecuencia de las ondas se mide en Hertz(Hz), en ciclos por segundo, representando la cantidad de veces que vibra por segundo un sonido o la cantidad de veces que se perciben sus ondas en un punto-lugar dado. A mayor vibración del sonido (o más ondas por segundo), más altas son las frecuencias y escuchamos sonidos agudos. A menor vibración, menos frecuencias, sonidos graves. Muchas frecuencias de sonido son imperceptibles al oído humano independientemente de su fuerza sonora o "volumen" (por ejemplo, algunos sonidos demasiados graves que emite un elefante, o los de altísima frecuencia que emite un murciélago). Nuestro oído solo capta frecuencias entre 15 y 20000 hz. Arriba de 20000 hz están los ultrasonidos. En resumen, la frecuencia es lo que los músicos llaman "tono".
La amplitud es otra característica: representa el "tamaño" de la onda, y por tanto, el "volumen" de la onda sonora (y es que algunas son "chaparritas" que casi no se oyen y otras "gigantes" que nos aturden los oídos). La amplitud se mide en decibeles(dB). El silencio absoluto representa 0 dB, un susurro a nuestro oído equivale a 10 dB, una ola de mar 40 dB, un avión 110 dB, y un sonido que nos provoca dolor 120 dB. La amplitud es lo que los músicos llaman "intensidad", "fuerza" del sonido. Para mí es el "volumen" de mi aparato electrónico. A mayor amplitud, más volumen y más dB que me pueden dejar sordo.
La tercer característica es la forma de la onda. Si tuviéramos ojos especiales para ver la forma de las ondas sonoras, me sería más fácil explicarlo. Usemos algo de imaginación para entender esta característica. Algunas ondas tienen "forma" muy "regular", "armónica", sin "distorsiones". Otras parecen crestas "irregularares”. No podemos asegurar que algunas son "normales" y otras "anormales", sino más bien que todas presentan un patrón de apariencia muy particular. Es lo que los músicos llaman "timbre". Podemos escuchar 2 instrumentos musicales diferentes que produzcan sonidos idénticos en frecuencia (agudos los dos), y en amplitud (en fuerza o volumen), pero nuestro oído humano identificará claramente cuál es un piano y cuál es una guitarra: el timbre o forma de onda de cada instrumento es diferente. Incluso, cada uno de nosotros tenemos un "timbre" especial en nuestra voz, de manera que no confundimos las voces de otros aunque todas cantaran en el mismo "tono" y "volumen".
Si una orquesta musical nos tocara alguna pieza musical "en vivo", entonces escucharíamos diferentes sonidos que vibrarían a diferente frecuencias y amplitudes. Pero si esa misma pieza la escucháramos desde un CD, es obvio que no percibiríamos la naturalidad del sonido escuchado “en vivo”. Diríamos que “suena” bien, pero no se parece exactamente al real. El “noise” (ruido o siseo que representa una carga excesiva de datos digitales), y la “electronificación” del sonido son problemas de antaño. ¿Cómo se intenta grabar sonidos y que se parezcan lo más posible a los reales¿. Bueno, hay 3 elementos que se toman en cuenta: 1) la tasa de muestreo (sampling rate) o cantidad de muestras que se toman. Así como un arqueólogo toma muestras de sus fósiles, así también en el audio digital se toman muestras de señales de audio. 2) la tasa de precisión (sampling precision), o gradaciones o niveles de cuantización de las muestras, es decir, la precisión con la cual se miden las muestras. Y, el más importante 3) el proceso de codificación. Efectivamente, el codificador es la pieza inteligente y sabia que procesará todas las muestras de audio. Mientras más poderoso sea un codificador de sonido, más cercano nos representará la realidad sonora. ¿Imaginas a un arqueólogo recolectando miles de “muestras” a sabiendas de que solo pocas de ellas son verdaderamente “fósiles”?. Yo tampoco. Entonces la grabación digital es más complicado de lo que suponemos. Si yo capturo 48000 muestras cada segundo de los sonidos que escucho, significa que estoy grabando a 48 Khz. Pero, ¿Cómo voy a valorar o medir cada muestra?. Aquí es donde empieza propiamente el trabajo del codificador. ¿Y una vez valoradas, cómo determino cuál muestra es apropiada y cuál no?. El codificador, quien se encargará además de acomodar cada frecuencia a su respectivo canal. Hay codificadores que no son capaces de distinguir, seleccionar y eliminar información digital sin contenido sonoro (el noise es parte de esa información digital). Cada codificador, al final del proceso, crea un producto o formato con ciertas características. El codificador tiene que calcular hasta que límite puede comprimir los datos digitales (o tal vez se decide no hacerlo) y hacer una selección del biltrate (la información digital que tendrá finalmente el producto o formato), de manera que la grabación suene equivalente al sonido real, natural.
Hoy por hoy, NO hay ningún codificador que pueda imitar el sonido real (la “electronificación” del sonido es un problema bastante complicado, que quizás se resuelva en otra era tecnológica, y lo mismo pasa con el video: aún el HD con sus 1980 pixeles jamás igualará a los colores naturales que percibimos con nuestros ojos, pero por lo pronto tomamos lo que hay). Los sonidos naturales pueden entonces ser transformados en datos digitales mediante un grabador digital que mide las ondas de los sonidos miles de veces por segundo. "Cada vez" representa una "muestra", entonces el grabador digital le otorga un valor numérico o dígito a cada una de estas medidas o muestras. Estos dígitos se convierten en una serie de pulsos electrónicos que se almacenan en una memoria para su conversión y reproducción posterior. La calidad del sonido reproducido depende potencialmente del número de muestras que se tomen por unidad de tiempo. La frecuencia de muestreo con que se graba digitalmente un sonido, se mide en kilohercios (kHz). Se supone que 44,1 KHz significan 44.100 muestras por segundo, el equivalente a la frecuencia de muestreo de un CD de audio; cada muestra consta de 16 bits de datos por cada canal estéreo. ¿Y qué es el bit?
El bit ("mordida") es parte del sistema binario usado en datos digitales, es como una moneda de 2 caras: solo puede valer 0 ó 1. Representa la unidad de información más pequeña procesada por un ordenador, y físicamente es un pulso eléctrico enviado a través de un circuito. En los discos magnéticos, el rayo láser crea agujeros microscópicos llamados “pits”, que dispersan y no reflejan la luz y son interpretados como “ceros” por la PC. El rayo láser deja también superficies sin agujeros llamados “lands” que sí reflejan la luz y equivalen a los “unos”. En el mundo del audio digital, los bits son combinados en grupos para formar "palabras digitales" que representan los valores cambiantes de amplitud de una señal analógica. La resolución de audio indica la cantidad de bits usados en cada "palabra digital", determinando el número de valores de amplitud. ¿Grabar señales analógicas de audio con más bits representa más calidad del audio?. En teoría sí, se supone que a mayor resolución de bits, mayor rango dinámico y amplitudes de audio. Por ejemplo, 8 bits proveen un máximo de 256 niveles de amplitud y 48 dB de rango dinámico. 16 bits proveen 65, 536 niveles de amplitud y 96 dB de rango dinámico. Pero ¿Y si la grabación contiene a su vez más noise y bits que no suenan o no contienen información sonora audible para nosotros?. El codificador más poderoso será el que pueda distinguir, seleccionar y eliminar bits que no poseen información sonora respecto a las ondas de audio muestreadas. Después de todo, lo natural debe tener un límite, para representar lo real no se requerirán millones infinitos de bits. Es cuestión de esperar un poco más los adelantos tecnológicos para ir comprobando que la representación natural del audio y video se obtiene con determinada información digital.
Regresamos ahora al tema del DVD. Un error fatal de mucha gente es creer que el mejor audio es aquel que tiene más datos digitales. Muchos creen que el solo hecho de comprimir equivale a pérdida de calidad. Sin embargo, en el campo de las imágenes digitales una fotografía nuestra en formato .jpg luce idéntica si la convertimos a formato .bmp. Pero hay una diferencia: .jpg ocupa menos espacio, comprime los datos sin pérdida de calidad de la imagen. Otro ejemplo: si tenemos algún archivo de 10 MB, basta comprimirlo con WinRAR y nuestro archivo ocupará menos espacio en nuestro disco duro. Podemos luego descomprimirlo y veremos que nuestro archivo no le pasó nada, sigue con la misma “calidad”. LA COMPRESION NO SIGNFICA PERDIDA DE CALIDAD. Físicamente representa “amontonar” los grupos de bits para que ocupen menos espacio. Recordemos que los bits son meros pulsos eléctricos y contienen información que puede ser procesada por codificadores avanzados o especiales. ¿Cuándo ocurre la pérdida de calidad en al audio e incluso en el video?. Pues potencialmente cuando grabamos audio a menores tasas de muestro, menor precisión de las muestras, reducimos el biltrate y un pésimo CODIFICADOR. En el video, cuando grabamos a poca resolución de píxeles, reducimos el biltrate y un pésimo CODIFICADOR.
Como puedes ver, la importancia de tener un excelente CODIFICADOR es esencial para tener buenos resultados tanto en audio como en video. Y es que el CODIFICADOR es el que determina finalmente las tasas de muestro o la resolución de píxeles, la precisión de las muestras, y la aplicación del biltrate en un formato determinado. El CODIFICADOR es el alma de un audio o video bien grabado. Eso lo sabe cualquier experto en la materia. Yo no soy ingeniero electrónico, ni programador, pero entiendo perfectamente este asunto. Entonces en el mundo del DVD tenemos que existen 3 formatos de audio: AC-3 (Audio Coding 3) , DTS (Digital Teather System) y PCM (Pulse Code Modulation). Para entender cada uno, es conveniente leer un poco de historia. Empecemos con el AC-3.
SOBRE EL CODIFICADOR AC-3
Ray Dolby, un ingeniero electrónico, junto con un equipo de colegas diseñaron en 1956 el primer videotape recorder. En 1965 fundó su propia compañía: Dolby Laboratorios, Inc. Ray Dolby sabía que las grabaciones analógicas presentaban un grave problema: el noise, ese ruido o siseo que surge aparentemente de la nada, opacando el sonido real grabado. (Actualmente sabemos que el noise es producido por el oxígeno presente en el cobre, metal usado en todos los aparatos electrónicos. No hay metal puro o libre de oxígeno 100%). Entonces en 1966, Dolby creó el primer electrónico capaz de reducir el noise en un canal, se llamó A301. La técnica se bautizó como Dolby A-Type NR, y permitió la grabación multipista que florecía en los años 1960 y 70´s. Así las canciones de los Beatles y artistas de todo el mundo podían ya grabar su música en multicanal. En 1972 el MSeries podía ya reducir el noise en 16 canales. Surgiría también el Dolby B. En el ámbito de Hollywood, Dolby demostró que su Dolby Cinema Sound (decodificó sonido mono óptico procesado desde Dolby A-Type NR, era mucho mejor que los equipos magnéticos que usaban. Para 1980 los films presentaban el logo de Dolby Stereo, pues Ray una vez más había logrado diseñar un formato impreso óptico de 35 mm (el Dolby Stereo), con ¡¡ 4 canales de salida!!. El cuarto canal era surround dedicado para sonido ambiental y efectos especiales. En 1982 surge el Dolby Surround, en 1986 logra otro gran avance: construye el Dolby SR que convertía y procesaba señales analógicas a digitales. La gran visión de Ray intuía que el audio digital entrañaba el reto de reducir los datos capturados y conservar la naturalidad del sonido. Ya en 1984, había diseñado el primer codificador digital o Dolby AC-1. En 1989 introducía un sistema más sofisticado: Dolby AC-2. Finalmente en 1992 diseña el actual AC-3, especialmente para aplicaciones multicanales que incluía los films de Hollywood y el sonido surround en el hogar.
Esta pequeña historia sobre Dolby nos hace entender el porqué las películas de Hollywood (desde 1977 con Star Wars y Encuentros Cercanos) usan básicamente audio en formato AC-3. De hecho, son contadas las películas que contienen DTS. El PCM está peor, es inexistente. Cabe aclarar que el equipo de codificación Dolby necesario para producir bandas sonoras no se enajena categóricamente, sino se alquila para las compañías y estudios productoras de films. Esta política, junto con el control de calidad aplicado a films de Hollywood con bandas sonoras por asesores Dolby, y el hecho de que Dolby confecciona procesadores de sonido de teatro con las mismas normas del equipo de codificación, ayudan a asegurar que en la presentación de audiencias de alta calidad esperen ver el nombre Dolby en el cine. Por lo tanto, Hollywood siempre ocupará la tecnología y equipo Dolby.
En la actualidad, tenemos Dolby Digital TrueHD, qua ya fue seleccionado como el “elegido” para el formato HD DVD y como opcional para el Blu-Ray. Entre sus muchas características están su tecnología MLP (propiedad de Dolby, tecnología de avanzada resolución para multicanal y stereo, que puede codificar arriba de 6 canales en 96 Khz/24 bit, o 2 canales de 192 Khz/24 bit, produciendo un sonido que es idéntico bit por bit al estudio master, y no pierde nada durante la codificación y decodificación), arriba de 18 Mbps biltrate y MAS de 8 canales de rango total desde 24 bits/96 Khz, soporte para HDMI (el cable de video-audio conductor del HD), etc. De nueva cuenta Dolby Digital será líder en las preferencias de Hollywood cuando el HD-DVD sea promocionado, o quizás el Blu-Ray.
¿Cómo trabaja el AC-3?
Mediante un complejo código esquemático o algorithmo, Dolby AC3 procesa la señal de audio basado en los principios de la psicoacústica (la ciencia que describe como percibimos el sonido). El codificador toma la ventaja de la reducción del noise y el enmascaramiento de la frecuencia para capturar el audio con suficiente precisión y asegurar que suene como el original, es decir, cuando no hay sonido, AC-3 disminuye considerablemente el noise y logra que las señales auditivas fuertes oculten el noise en otros tiempos. Si hay señales en algunas partes del espectrum, reduce el noise en otras frecuencias donde no hay señales de audio dejándolo imperceptible.
Este es uno de los aspectos clave del AC-3, pues al eliminar y reducir SELECTIVAMENTE el noise en todas las frecuencias, la calidad del sonido original puede preservarse. A nadie nos gusta oir el siseo horrible, que solo representa una carga brutal de bits en el audio grabado. El segundo aspecto clave del AC-3, es que puede seleccionar y distribuir los bits entre los canales tomándolos desde un banco común de bits (el input buffer). Esta técnica permite mandar más bits a los canales que demandan mayor contenido de datos, y dejar “solos” los canales escasamente ocupados o con poca demanda de datos. El AC-3 distribuye los bits en paquetes de 24 o más, entre los filtro de banda de acuerdo al particular espectro de frecuencia, registrando una cantidad suficiente de bits que describen la señal de audio en cada banda. El AC-3 posee capacidad para procesar audio-señales de 20 Hz a 20 Khz en 5 canales de rango completo, y en el canal LFE de 20 a 120 Hz. El producto final del AC-3 es comprimido. Las películas de Hollywood siempre emplean AC-3, el idioma inglés viene en 448 kbs, 48 Khz, 24 bits, mientras que los idiomas de otros países vienen en 384 kbs. Los menús en 192 kbs. Por razones técnicas, los DVD no pueden tener AC-3 con biltrate superior a 448 kbs.
A mayor poderío del algoritmo, más preciso será el codificador para eliminar bits sin afectar la calidad del sonido percibido. Esta es la razón del porqué algunos codificadores de tecnología tal como Dolby Digital AC-3 puede sonar tan bien como el DTS el cual emplea de 2 a 4 veces más de datos. Incluso, pruebas hechas con oyentes críticos no pudieron distinguir cuál era sonido codificado con AC-3 y cuál el original master tape.
Sobre el DTS
Surgió en 1993 en California (USA). No hay suficiente información sobre el DTS, quizás porque sea un “joven” en el mundo del audio. Hablemos sobre el codec DTS. El codificador DTS destinado al DVD es capaz de muestrear tasas de 48 a 96 Khz, 24 bits de resolución de audio, 6 canales o 5.1 surround. Su producto final es muy poco comprimido, por lo cual ocupa mucho espacio y emplea biltrates de 768 kbs a 1536 kbs.
La tendencia del DTS es la venta de electrónicos con dicha patente. Sin embargo, el DTS necesita del equipo Dolby, pues los estudios de Hollywood, en donde graban y "masterizan" el audio, se realiza con los equipos de Dolby. Otra razón por la cual Hollywood no se interesa mucho por el DTS, es que no todos los equipos electrónicos tienen DTS, mientras que el Dolby existe en cualquiera. Es cierto que dentro de poco tiempo tendremos más electrónicos con DTS, pues recién se firmó un tratado entre DTS y Sunplus (empresa mundial manufacturadora de chips con MPEG IC), pero el DTS no es más que un codec que procesa más bits de información para poder igualar al AC-3.
¿Cuál es el futuro del DTS?. El DTS-HD con 7.1 canales discretos, bit-por-bit idéntico al sonido masterizado (en equipos Dolby), y ha sido escogido como “opcional” para las producciones de Hollywood.
SOBRE EL PCM
Es el método creado por Microsoft para digitalizar audio, es incomprimido y se usa en los formatos WAV y AIFF. No tiene futuro, aunque sirve como “medio” para transcodificaciones y reencodificaciones.
SOBRE EDICION DE AUDIO PRESENTE EN DVD
Ahora comentaré mis experiencias para editar audio en DVD. Queda claro que el formato AC-3 es el indicado y el standard para el audio en DVD.
¿Te gustaría agregar, a un DVD comercial ya authorado, tu voz para presentar el título del DVD, agregar efectos de sonido, o cualquier cosa sonora que se te ocurre en la misma pista de audio original, semejante a como lo hacen casas editoras de DVD?.
Como ya comenté, AC-3 es un formato de audio de 6 pistas o canales, con 448 kbs de biltrate. En la actualidad, no hay programa capaz de editar AC-3 en su forma "nativa", sino que hacen un transcoding (cambio de formato) generalmente al .WAV incomprimido, sobre el cual realizan los cambios o ediciones de audio deseados y entonces exportan un nuevo AC-3. Ejemplos de programas que "editan" AC-3 es Maven 3D Pro, Nuendo, etc., pero todos ellos realizan un transcoding para ejecutar sus tareas. Es obvio que el transcoding es nefasto, pues se pierde algo de la calidad del audio. Cualquier transcoding ya sea en audio o en video cuyo propósito sea exportar un nuevo archivo en formato del archivo original o "transcodificado", siempre será una potencial pérdida de calidad. El transcoding no es recomendado (lo mismo y hasta peor es la demasiada reducción del biltrate), pero para editar AC-3 será necesario. Pues bien, los archivos de audio contenidos en una película contienen generalmente las voces de los actores en el canal central. Los demás canales contienen la música de fondo, los efectos de audio y las voces secundarias (de la gente, murmullos, gritos, etc.).
EDITANDO UNA PISTA COMPLETA DE AUDIO EN UN DVD
1.- Copia la película en tu PC.
2.- Extrae video, pistas de audio, subtítulos y tiempos de las celdas con PgcDemux.
3.- Selecciona la pista .AC3 que deseas editar y transcodifica a 6 .WAV monos con BeSweet (al transcodificar, BeSweet exporta los 6 .WAV en 48 Khz, 16 bit, 768 kbs).
4.- Con tu programa de edición de audio (Audition, Sound Forge, etc.) edita los .WAV que deseas, agregando voz y sonidos. Si se desea editar todos los 6 .WAV, entonces cada uno debe ser editado individualmente y exportado como tal. Aquí depende del gusto personal.
5.- Con BeSweet vuelve a reunir los 6 mono .wav a .ac3: primero crea un archivo de texto (.txt), edítalo escribiendo el directorio que contiene los 6 wav y los nombres de cada .wav (por ejemplo:
C:\Escritorio\audio c.wav
C:\Escritorio\audio fl.wav
C:\Escritorio\ etc.
Cada archivo debe ser escrito en un renglón diferente). Luego renombra la extensión del archivo .txt a .mux. Abre BeSeet y en input configura .mux, abre, y elige salida .ac3, configura biltrate y número de canales. También puedes usar Sonic Foundry Soft Encode o Scenarist (recuerda ajustar los parámetros del .AC3 a 448 kbs (si la pista es inglés), 384 kbs (si es otro idioma)).
6.- Sigue la guía "Edición de subtítulos de DVD", pasos 6 a 9.
EDITANDO SOLO UN FRAGMENTO(S) DE UNA PISTA COMPLETA
1.- Copia la película en tu PC.
2.- Extrae el video, subtítulos y tiempos de celdas con PgcDemux en modo "by PGC". El demux del audio debe hacerse en modo "Single Cells", eligiendo una por una y renombrando cada archivo a otro nombre diferente al default que coloca PgcDemux. Al hacer el demux, habrá archivos "Audiofile_80.ac3", "Audiofile_81.ac3", etc., según la cantidad de idiomas habidos en la película.
3.- Transcodifica los clips-capítulos de audio deseados con BeSweet.
4.- Edita los clips con tu programa favorito para editar audio, y exporta como .wav mono.
5.- Usa BeSweet, Sonic Foundry o Scenarit para convertir los 6 .wav mono a .ac3.
6.- Sigue la guía "Edición de subtítulos", pasos 6 a 9. NOTA: Es obvio que tendrás una colección numerosa de clips de audio .ac3, algunos para determinado idioma, los cuales tu deberás identificar y no confundir (de ahí la importancia de renombrar cuando PgcDemux hace el demux del audio por celdas). Con Muxman deberás reunir todos los clips de audio para cada idioma.
Existe otra manera de simplificar este método, pero implica el manejo de PgcEdit, en donde se hacen modificaciones en el número de celdas para que PgcDemux extraiga solo las deseadas.
COMO MEJORAR EL AUDIO DE NUESTROS VIDEOS DOMESTICOS
Sin duda alguna, cuando editamos nuestros videos domésticos, generalmente nos preocupamos por el video e ignoramos la edición del audio. Al final, cuando quemamos nuestro video en DVD nos damos cuenta tardíamente que el audio suena horrible, con mucho noise, con poco volumen, quizás algunos sonidos demasiados altos y muchos demasiado bajos en volumen. ¿Cómo resolver estos problemas?.
PRIMER PASO, LA CAPTURA: Primero que nada, es importante que nuestra PC capture el audio en 48, 000 khz (no importa si el video es .mpg o .avi), pues el DVD requiere dicha característica (incluso el cambio o resample de 44,100 a 48,000 o viceversa NO es recomendado por ningún experto pues se generan problemas como distorsión del sonido-tiempo y otros).
SEGUNDO PASO, ABRIENDO EL ARCHIVO DE AUDIO: Con Adobe Audition (o algún programa semejante de edición de audio), click en "File", y del menú elige "Open Audio from Video" (si el audio está anexado al video), o "Open Audio" (si el audio está separado del video). Adobe tardará algunos momentos para extraer el audio (a mayor duración del video, más tiempo para extraer), aunque si se trata de audio separado lo hará más rápido.
Por otro lado, si se edita con Adobe Premiere el problema se simplifica. Adobe Premiere puede importar .avi, .mpg, .vob, y muchos otros formatos. Cualquier archivo de audio es transcodificado a la tasa de muestreo que se configura en el proyecto, además de codificarse a 32 bit floating-point en un formato de audio(.cfa)propio de Premiere. De esa manera Premiere trabaja con un formato de audio de alta calidad. Es conveniente al principio separar (Unlink)el video del audio en Premiere, luego editarlo (hacer los cortes, aplicar efectos, etc.), y cuando la edición esté terminada, entonces conviene seleccionar y exportar el audio solamente en formato .wav, 32 bits. Luego, en Audition se abre ese archivo para editar el noise y volumen. NOTA: Al exportar con Audition, se recomienda .wav, 32 bits, para que la calidad no disminuya. Una vez exportado el audio desde Audition, en Premiere se elimina el clip de audio que contenía noise y se reemplaza por el nuevo editado con Audition. Vayamos al tercer paso...
TERCER PASO, ELIMINANDO EL NOISE: El "noise" es ese ruido de fondo parecido a un "ssss" que se genera por el oxígeno contenido en el cobre de los circuitos electrónicos. Cualquier cámara de video (analógica o incluso DV)genera noise que se debe eliminar inmediatamente antes de aplicar algún efecto al audio. Es muy conveniente que grabemos --en nuestra cámara de video-- algunos segundos sin contenido sonoro --o de silencio-- al inicio de nuestro video, y que nuestra PC lo capture. Esos segundos de silencio serán el NOISE de muestra. En Audition, en modo "Edit View", elige los segundos que "no contienen" sonido. Puse "no contienen" porque en la realidad si contienen algo: el sonido del noise. Elige con click izquierdo del mouse el momento en que inicia ese "silencio" que contiene noise y arrastra el mouse hasta otro momento o final del noise. Puedes hacer click en play para comprobar que se trata de un silencio-noise.
Click en "Windows" y comprueba que "Organizer" esté habilitado. Si "Organizer" está habilitado verás a la izquierda una ventana conteniendo 3 botones: Files, Effects y Favorites. En Effects elige Noise Reduction para abrir un submenú desplegable. De este submenú elige "Noise Reduction" y entonces se abrirá una pequena ventana. Click izquierdo en "Capture profile", y entonces Adobe analizará la porción de audio para identificar el noise. Click en "Preview" para oir cómo se escuchará el audio sin noise. Si consideras que está muy alto la reducción del noise, entonces desliza a la izquierda el botón del "Noise Reduction Level" (de 0 a 100). Click luego en "Select Entire File", y por último en "O.K.". Deja los demás settings como están, Adobe tiene por default los mejores parámetros para cualquier archivo en general.
CUARTO PASO, AUMENTANDO EL VOLUMEN DEL AUDIO: Es ideal aumentar el volumen lo "más que se pueda" para cada una de las frecuencias del audio. En Adobe Audition, el máximo volumen para el audio está representado en los 0 db. Eso es lo que se llama "Normalizar". Un sonido "normalizado" es aquel que está en 0 db. Cualquier sonido arriba de 0 db --en la escala de "Normalización"-- es considerado más fuerte de lo normal y en consecuencia se oirá distorsionado. Cualquier sonido debajo de los 0 db debe ser aumentado en volumen sin romper con la armonía y naturalidad y de los sonidos. No confundamos los 0 db de esta escala de Normalización con los 0 db o silencio en la escala de amplitud del sonido (la escala usada por la Física).
Si intentáramos aumentar el volumen de todas las frecuencias a 0 db, sin sobrepasar la medida, nos llevaría bastante tiempo en elegir cada una de las frecuencias y aplicarle el aumento deseado. Sin embargo, en Adobe Audition existe una función que permite eso en unos cuantos segundos: Hard Limiting.
Click en "Amplitude" para abrir desplegable, entonces elige "Hard Limiting". Configura los siguientes parámetros así: "Limit Max Amplitude to" en 0 db, "Boost Input by" en 20 db. Los demás así como están por default. Con tales parámetros el volumen de nuestras frecuencias de audio aumentarán hasta 20 db pero sin rebasar los 0 db de la escala mencionada antes.
Si algunas frecuencias necesitan solo 10 db para quedar normalizadas, entonces solo aumentarán 10 db. Si algunas necesitan 20 db, entonces aumentarán 20 db. Si otras necesitaran 40 db, aumentarán solo 20 db, pues el "Boost Input by" solo permite aumentar un máximo de 20 db (considerando ese setting, pues si tu necesitas aumentar más puedes configurar "Boost Input by" en 30, 40, 60 db, pero ten en cuenta que el audio perderá su naturalidad: si se trata de voces humanas parecerán que todas hablan fuerte o gritan aún cuando susurran originalmente).
Personalmente, yo prefiero indagar antes cuántos db necesita aumentar un clip de audio, usando la herramienta "Amplitude", opción "Amplify/Fade", "Calculate Now", entonces Audition nos señalará cuántos db necesitará el clip. Al valor o nivel que se requiere le agrego 6 db más (aunque aquí cuentan mucho las características del audio original y las necesidades de edición personal). Puedes hacer click en Preview antes de aplicar el efecto, si te gusta haz click en OK. En caso de que no te guste, modifica el valor para "Boost Input by".




