El análisis de espectrogramas es una forma visual de mostrar los datos en un archivo de música. Cada nota musical posee una frecuencia específica: las notas más bajas tienen frecuencias bajas y las notas altas tienen frecuencias altas. Todas las frecuencias se muestran en un diagrama para espectrogramas, el cual es una gráfica de todas las frecuencias vs el tiempo en cada archivo de música. Las frecuencias se miden en hertz (Hz) y kilohertz (1.000 Hz). Los humanos tienen un rango auditivo de entre 20 Hz – 20kHz (20.000 Hz).
Ya que los espectrogramas muestran todos los datos en un archivo, son herramientas muy útiles para saber si una canción ha sido convertida o no. Todos los archivos tienen, relativamente, un corte estándar en la frecuencia.
Haz click en cualquiera de los espectrogramas siguientes para verlos en alta resolución.
Las canciones en un CD comercial y las canciones en archivos lossless poseen frecuencias que se extienden hasta los 22 kHz. Teniendo en cuenta que la conversión de lossless a lossless preserva todos los datos en un archivo de música, el espectrograma de una canción lossless se verá de la misma manera en FLAC, WAV (PCM), ALAC, etc.
Sin embargo, según el género musical, los espectrogramas se verán diferentes. El ejemplo de arriba es de una canción pop, representándose la mayoría de las frecuencias. Pero échale un vistazo a esta canción clásica de piano.
¿Se ve muy diferente, verdad? ¡Pero aún así es un espectrograma lossless! Date cuenta cómo el “ruido blanco” (el púrpura claro) se extiende hasta los 22 kHz, incluso cuando esas frecuencias no son utilizadas.
Los diferentes tipos de MP3’s tienen diferentes cortes de frecuencia. Los MP3’s, además, suelen tener un “pequeño corte” a los 16 kHz (lo verás en los espectrogramas).
MP3 320kbps (CBR) tiene un corte de frecuencia a los 20.5 kHz.
MP3 256kbps (CBR) tiene un corte de frecuencia a los 20 kHz.
MP3 V0 tiene un corte de frecuencia a los 19.5 kHz.
MP3 192kbps (CBR) tiene un corte de frecuencia a los 19 kHz.
MP3 V2 tiene un corte de frecuencia a los 18.5 kHz.
MP3 128kbps (CBR) tiene un corte de frecuencia a los 16 kHz.
¿Cómo es posible que los espectrogramas sean útiles a la hora de detectar transcodes (malas conversiones)? Supongamos que descargaste de un blog una canción en FLAC. La única manera de verificar si esa canción es verdaderamente lossless y no un transcode es analizando su espectrograma. (Programas como AudioIdentifier no son confiables a la hora de detectar transcodes).
Por ejemplo, el espectrograma siguiente es de un archivo FLAC: la extensión es .flac, pesa 21.8 MB y suena bien.
Pero sorpresa, ¿eso realmente se ve como debería verse un espectrograma regular de un FLAC? ¡No! Este archivo fue convertido desde un MP3 192kbps (CBR) hacia un FLAC. Es una conversión de lossy a lossless, lo cual es malo.
Para el análisis de espectrogramas, recomendamos utilizar Adobe Audition (Windows o macOS), Audacity (Windows, macOS, Linux), y SoX (Windows, macOS, Linux — en línea de comando solamente). Todos los espectrogramas que aparecen en esta guía fueron visualizados en Adobe Audition CS 6.
Más allá de que deberías utilizar el análisis de espectrogramas para determinar si un archivo es un transcode o no, tendrás que utilizar otro programa para determinar el bitrate o la programación del encode que el archivo dice ser. Para este propósito, recomendamos utilizar Audio Identifier o dbPowerAmp en Windows y dnuos o MediaInfo en macOS.