Audio PCM: La tecnología que revolucionó el sonido digital

El audio PCM (Pulse Code Modulation) representó un avance crucial en la historia del sonido digital. En un momento en que tecnologías como los PSG y la síntesis FM generaban audio mediante ondas programables, el PCM introdujo la capacidad de reproducir sonidos reales, incluyendo instrumentos complejos y voces humanas. Esta innovación transformó la experiencia auditiva en videojuegos y sistemas retro, ofreciendo un mayor realismo a pesar de sus exigencias de memoria y procesamiento. Con el tiempo, el PCM se convirtió en la base de los formatos de audio actuales, marcando un hito en la evolución de la tecnología sonora.

¿Qué es el audio PCM?

El audio en los primeros ordenadores era programable, esto significa que no venía en forma de archivo de audio, sino con una serie de instrucciones que le dicen al sistema cómo ha de generar el sonido. La primera generación estuvo representada por los llamados PSG, los cuales reproducían un tipo de onda concreta y cuyo representante más popular fue el AY-3-8910. Podían generar melodías y efectos simples, pero no reproducían todos los instrumentos. La segunda generación vino en forma de la síntesis FM, la cual seguía siendo programable, pero ya podía simular una completa gama de instrumentos, pero con la limitación de no poder emular las voces humanas y ciertos instrumentos.

SPC-700 chip sonido SNES Audio PCM
El famoso chip de sonido de SNES, reproducía hasta 8 canales PCM

La solución a este problema venía con el audio PCM inicialmente, se trataba de pequeñas pistas de audio para reproducir efectos de sonido concreto pregrabados los cuales son llamados muestras o samples en inglés. Básicamente, en vez de generar una onda y manipularle de una u otra forma, como ocurría con los chips PSG o la síntesis FM, lo que hace es convertir la información de dichas muestras en audio. Por lo que se trata de una solución que permite generar cualquier tipo de sonido. Sin embargo, tiene una limitación, ya que requiere una gran cantidad de memoria para reproducirse, y de paso también de procesamiento. Por lo que en los primeros sistemas se encontraba limitado a efectos especiales concretos, pero especialmente para reproducir voces humanas.

Las ventajas del audio PCM

El audio PCM es, por tanto, una forma de codificar el audio y poderlo reproducir en cualquier tipo de dispositivo, mientras que la síntesis FM y la generación de audio vía PSG se basa en la ejecución de una serie de instrucciones, habitualmente asociada a un set de instrucciones y de registros concreto. Esto significa que nos encontramos ante una forma universal de codificar y reproducir el sonido, no solo en videojuegos, sino también en el mundo de la música.

Digitalización Audio PCM

Hemos de partir que se trata de la digitalización de una señal analógica continua en el tiempo en una digital. Desde el momento en que los sistemas informáticos operan en binario, ha de haber una conversión de la información. Claro está que esto permite almacenar la información de audio como información que puede gestionar un microprocesador, el cual se encargará de generar el audio a partir de la información. Todo esto lo convierte en una solución altamente versátil y adaptable, que ha marcado el estándar en la reproducción de sonido en diversas industrias, desde videojuegos hasta música y cine

El uso en tarjetas de sonido

Las limitaciones de la síntesis de FM obligaban a muchos sistemas de reproducción y producción de audio tuvieran soporte para audio PCM para poder reproducir cualquier tipo de fuente sonora, lo que les llevaba a tener no solo capacidades de síntesis FM, aunque en los primeros modelos por limitaciones de memoria y procesamiento la capacidad para el audio PCM era limitada, pero con el paso del tiempo fueron perdiendo la capacidad de reproducir audio PCM.

Sound Blaster 16
La Sound Blaster 16 trajo el sonido con calidad CD al PC

Por ejemplo, la primera Sound Blaster aparte de los 9 canales de síntesis FM, tenía un canal adicional PCM, el cual funcionaba bajo una frecuencia de muestreo de 22 KHz con una cuantización de 8 bits. En realidad, fue la Sound Blaster 16 la que supuso el salto completo en el mercado de masas al uso de audio PCM, aunque antes habían aparecido modelos como la IBM Music Feature Card de 1987 o la Adlib Gold 1000, ambas orientadas al mercado profesional, pero fue la Sound Blaster 16 la que se convirtió en el estándar de facto durante muchos años. Esta fue la primera tarjeta de sonido con la capacidad de reproducir audio en calidad CD completa, 44.1 KHz de muestreo y con calidad de 16 bits, pero solo con dos canales de audio.

Todo ello sin dejar de lado el chip de audio de SNES, el cual, pese a encontrarse limitado por disponer de solo 64 KB, disponía de 8 canales de sonido y la capacidad de reproducir sonido a un muestreo de 32 KHz con una cuantización de 8 bits, lo que le dio a la consola de 16 bits de Nintendo la superioridad sonora respecto a su rival, la Mega Drive/Genesis de SEGA.

¿Cómo funciona?

El audio PCM (Pulse Code Modulation) funciona como una animación dibujada a mano, donde cada dibujo que representa un cuadro de la animación es una muestra del sonido. Estas muestras son puntos tomados de una onda de sonidos en diferentes momentos, que al reproducirse rápidamente recrean el sonido original. Mientras más muestras se tomen, más suave y natural sonará dicho sonido al reproducirse.

Compact Disc CD
El CD popularizó el audio PCM, no solo en la música, sino también en los videojuegos.

El primero de los puntos que define una muestra en el audio PCM es la frecuencia de muestreo, que es la cantidad de muestras que reproduce por segundo. En este contexto, cuanto más alta es la frecuencia, más detallado y natural será el audio reproducido. Por ejemplo, 8,000 Hz es suficiente para voz básica (teléfonos), mientras que 44,100 Hz es estándar para música en CD. Una frecuencia baja puede sonar entrecortada, mientras que una alta es más rica y fiel al sonido original.

El segundo punto son los bits de muestreo o cuantización, los cuales almacenan el volumen donde el equivalente en una imagen sería como la cantidad de colores que puede representar el píxel de una imagen. Así pues, cuantos más bits tenga una muestra, más niveles de volumen se pueden representar, dando más calidad al sonido. Por ejemplo, 4 bits permiten 16 niveles de volumen, mientras que 16 bits ofrecen 65,536 niveles, ideales para audio de alta calidad. Sin embargo, más bits también requieren más espacio en memoria.

Canales de sonido y memoria ocupada

Los canales de sonido en el audio PCM al igual que en los PSG y la síntesis FM, representan la cantidad de fuentes de sonido simultáneas donde cada una de ellas reproduce una muestra de audio con su propia frecuencia y bits de muestreo. Por ejemplo, en música, un canal puede llevar la melodía y otro la percusión. Los sistemas de audio pueden tener un solo canal (mono), dos canales (estéreo, uno por cada oído), o más en configuraciones avanzadas como 5.1 (cine). Cuantos más canales tengas, más realista y envolvente será el sonido reproducido.

Muestreo cuantifación audio PCM

Por otro lado, la cantidad de información necesaria para almacenar un archivo de sonido se multiplicará por la cantidad de canales que utilice. Para entenderlo mejor, vamos a tomar como ejemplo el canal PCM de la Famicom/NES (mono) que reproduce muestras a 16 KHz a 6 bits de muestreo, 96000 bits por segundo, es decir, aproximadamente 12 KB por segundo reproducido. Una barbaridad de espacio, si tenemos en cuenta las limitaciones de memoria de los sistemas de 8 bits.

En realidad, no fue hasta la aparición del CD que el audio PCM empezó a tomar importancia en los juegos, ya que dicho formato tenía la suficiente capacidad para almacenar las muestras. Si bien ciertos sistemas como el Commodore Amiga y la Super NES/Famicom basan su audio en este tipo de audio, se ven limitados por la poca memoria disponible, lo que limita la duración y la calidad de la música reproducida.

Formatos comprimidos y su relación con el audio PCM

Como ya hemos visto, el uso de audio PCM si bien permite la reproducción de cualquier tipo de sonido al mismo tiempo, requiere una gran cantidad de sonido, por lo que a medida que las capacidades de procesamiento de los sistemas fueron avanzando, se añadieron formatos comprimidos que permitían ahorrar espacio perdiendo muy levemente la calidad del audio original.

El iPod original
Los reproductores MP3 como el iPod son un ejemplo de la aplicación del audio PCM.

Podemos separar los formatos comprimidos en dos tipos distintos:

  • Compresión con pérdida (MP3, AAC): Se trata de formatos que eliminan la información que el oído humano no puede percibir. Aunque el resultado no es exactamente igual al original, suelen ser indistinguibles para la mayoría de los oyentes. Por ejemplo, una canción en PCM puede ocupar 50 MB, mientras que en MP3 solo 5 MB.
  • Compresión sin pérdida (FLAC, ALAC): Comprimen los archivos sin perder datos, por lo que al descomprimirlos se obtiene el audio PCM original. Son ideales para audiófilos o proyectos que requieren alta fidelidad.

Sin embargo, su uso tiene que ver más bien con el mundo de la música y no de los videojuegos, ya que la descompresión requiere no solo potencia de cálculo, sino que además añade latencia adicional, lo que provoca un desfase entre la acción y el audio reproducido. No obstante, esto es testigo de cómo el audio PCM se ha convertido en el estándar de facto y fue revolucionario para la música, ya que permitió llevar varios discos de música embebidos en el reproductor, lo que supuso el abandonó progresivo del formato físico en la música para quedar relegado al público entusiasta, pero minoritario.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio