A partir de 1984, la calidad del sonido en los videojuegos hizo un salto de gigante, al menos en los salones recreativos. ¿El motivo de ello? La adopción de la síntesis FM. Su particularidad era la de poder emular sin problemas instrumentos de la vida real, por lo que fue un salto cualitativo en lo que a la calidad de sonido se refiere. En este artículo intentaremos explicaros cómo funciona y por qué fue revolucionaria, así como sus limitaciones.
Los orígenes de la síntesis FM
Lo que conocemos como síntesis FM fue una invención de John Chowning. Quien en el otoño de 1967, él se encontraba modulando un sonido usando dos osciladores de onda seno con dos funciones diferentes cada uno. La primera de ellas generaba el tono de la nota (pitch), mientras que la segunda onda se encargaba de variar dicho tono. Nada especial, hasta que se le ocurrió experimentar y descubrió un cambio en la naturaleza del sonido reproducido que le sorprendió. La síntesis FM había nacido y Chowning como estudiante de la universidad de Stanford, pasó años investigando sobre su descubrimiento.
En realidad, fue la experiencia de Chowning como músico la que le permitió descubrir la síntesis FM. Y su nombre se debe a que decidieron experimentar con frecuencias funcionando a ratios de frecuencia modulada, la cual funciona en MHz y es donde los cambios en el timbre de los sonidos generados se daban. Con el paso del tiempo, él fue redefiniendo la técnica, descubriendo cómo las diferentes formas de manipular una onda portadora con varias moduladoras podían crear diferentes tipos de instrumentos con los que creó una compleja librería.
La participación de YAMAHA
Si bien el descubrimiento de Chowning fue revolucionario, no hubiese pasado de ser una investigación universitaria caída en el olvido, si no fuese por el hecho que la japonesa YAMAHA se interesó por dichos descubrimientos para darle una salida comercial.
El primer teclado con síntesis FM que apareció al mercado fue el YAMAHA GS-1 lanzado en 1981 con la apariencia de un piano tradicional de 88 teclas. Tenía la capacidad de reproducir 16 voces polifónicas y 8 operadores de voz. Sin embargo, su enorme tamaño y precio hicieron que se vendieran unos cuantos centenares y poco más. Dicho modelo fue acompañado por el también fracasado YAMAHA GS-2 con la misma cantidad de voces, pero con 4 operadores.
Su alto coste se debía al uso de una gran cantidad de chips para funcionar, ni más ni menos que 12 chips en total. Además, tenía la limitación de que no era directamente programable, lo que limitaba su versatilidad.
El YAMAHA DX7
El boom de la síntesis FM vino de la mano del YAMAHA DX7, un teclado tan icónico y popular que la mayoría de los grupos comerciales de éxito lo usaron, lo que hizo que se convirtiera en el teclado de referencia y el encargado de popularizar la síntesis FM entre una generación de músicos de los 80. Dicho de otra forma, el sintetizador que definió la música de esa década era ni más ni menos que el DX7 de YAMAHA. El cual fue usado por grupos como Queen, por los músicos de solistas como Whitney Houston y en total una gran lista de músicos.
La clave de su éxito se debió a una reducción de su coste, gracias al hecho de usar menos chips que el GS-1 y el GS-2, de los 12 gracias a la integración VLSI se pasó a solo 2: el YM21290 EGS (envolvente) generaba los datos de frecuencia y envolvente, los cuales eran enviados al YM212805 OPS (operador), que se encargaba de generar las formas de onda del sonido. Tenía la capacidad de reproducir 16 notas al mismo tiempo con 6 operadores por nota. Por lo que se situaba en capacidad entre el GS-1 y el GS-2.
Aunque su mayor novedad fue la capacidad de programar el audio para crear melodías complejas a través del lenguaje DX7, lo que permitía la creación de muestras de sonido o samples. Para ello, YAMAHA creó el lenguaje DX que permite manipular la síntesis FM (modulación de frecuencia) de manera detallada. Dicho lenguaje permitía ajustar valores como la frecuencia de las ondas, la envolvente, la modulación, entre otros, para diseñar sonidos complejos. No obstante, no se trataba de un lenguaje de programación al uso como C o BASIC.
Y la síntesis FM llegó a los videojuegos
El hecho de que YAMAHA fuera el proveedor de varias empresas de videojuegos abrió la posibilidad de que la síntesis FM llegara al mundo de los videojuegos. No en vano, la empresa japonesa era la que fabricó el clon del AY-3-8910 y el TMS9918A para sistemas japoneses como la primera generación del estándar MSX y la SG-1000 de SEGA. Por lo que tarde o temprano ambos mundos se terminarían encontrando. El primero de los chips vino en 1984 y fue el YAMAHA OPN o más conocido como YM2203, el cual solo disponía de 3 canales FM con 4 operadores, pero que integraba también la circuitería del YM2149, el clon del AY-3-8910 en el interior para efectos de sonido.
El chip no solo se utilizó en multitud de máquinas recreativas, sino que sistemas como el MSX2, la SEGA Mark III/Master System o el NEC PC-88 MK II SR ofrecieron capacidades de expansión que permitían colocar este chip y mejorar las capacidades sonoras de diferentes juegos. Para que os hagáis una idea del salto radical, os dejamos en primer lugar la versión para el YM2149/AY-3-8910 de tema Magical Sound Shower del clásico OutRun, el cual usa sonido PSG y no síntesis FM.
Y si lo comparamos con el que se obtiene gracias a la síntesis FM del YAMAHA OPN, se puede ver una diferencia en la calidad de sonido que incluso el oído menos entrenado puede notar. Fijaos cómo los sonidos generados pasan a parecerse mucho más a los instrumentos reales.
Evolución y legado
C
Si bien el YAMAHA OPN fue el chip que popularizó la síntesis FM en los videojuegos, su influencia se limitó más bien a los salones recreativos y a máquinas japonesas. El motivo detrás de ello está en la baja popularidad del estándar MSX en occidente y el hecho de que la versión occidental de la SEGA Master System careciera del YM2203 de su versión japonesa.
El primero de los chips de síntesis FM que tuvieron una gran influencia en el mercado occidental fue el YM2612, el cual se usó en la consola de 16 bits de SEGA, la Genesis/Mega Drive, y disponía de 6 canales distintos con 4 operadores. Desde cierto punto de vista, no dejaba de ser dos YAMAHA OPN en un solo chip.
Tampoco nos podemos olvidar de la mítica Sound Blaster, la cual usaba el potente YM3812, un chip de síntesis FM con la capacidad de reproducir 9 notas polifónicas o canales con hasta 18 operadores distintos, lo que la convirtieron en uno de los componentes más populares para PC en la primera mitad de la década de los 90.
Con el paso del tiempo, los chips de síntesis FM fueron sustituidos por los chips capaces de reproducir pistas de audio en PCM, las cuales no tenían problemas para reproducir cualquier tipo de sonido. No en vano, buena parte de las tarjetas de sonido para paliar las limitaciones de la síntesis FM empezaron a incorporar hardware para reproducir sonidos reproducidos por modulación por pulsos codificados, la cual fue tomando fuerza con el tiempo, especialmente con el advenimiento del CD, pero eso ya es una historia totalmente distinta.
¿Cómo funcionaba la síntesis FM?
Tras el rápido repaso histórico, ahora nos toca hablar de cómo funciona la síntesis FM, para que entendáis cuáles son sus principios y no os parezca magia. Desde aquí dejaros claro que no somos expertos en música y sonido, por lo que si hemos malentendido algún concepto, rogamos que nos digáis para una posterior corrección de este mismo artículo.
Como los símiles son la forma más rápida de entenderlo, vamos a comparar la creación de sonidos a través de la síntesis FM con preparar una sustancia química, es decir, vamos a combinar los ingredientes de una determinada manera para obtener un nuevo compuesto que será el nuevo sonido resultante. En nuestro caso, los ingredientes son los operadores.
Por lo que un operador no es más que un generador de onda que puede hacer dos cosas: producir un tono (portador) o modificarlo (modularlo) y se puede combinar de formas concretas entre diferentes operadores para crear lo que llamamos algoritmos. Cada uno de los operadores en la síntesis FM utiliza 4 valores: frecuencia, nivel de salida, multiplicador y envolvente.
Algoritmos
La combinación concreta de varios operadores entre sí se llaman algoritmos y son lo que le da naturaleza al sonido. Cuanto más operadores, más moldeable será la onda y más cercana a reproducir el sonido del instrumento real.
Para conseguir generar los diferentes tipos de timbre característicos de cada instrumento, los operadores se pueden combinar de diferentes formas: en cascada, en paralelo, retroalimentando unos a otros. Las combinaciones que podemos conseguir se ven limitadas por la cantidad de operadores que se tengan a mano para generar los diferentes algoritmos. Por ejemplo, en las dos imágenes de arriba podemos ver la cantidad de algoritmos posibles con 6 y 4 operadores.
Por lo que la calidad del audio no dependía de la cantidad de canales, que no deja de ser la cantidad de notas simultáneas a reproducir, sino de lo que se podía conseguir en cada canal. Obviamente, los chips pensados para videojuegos eran menos versátiles en comparación con los utilizados por los músicos profesionales.
Limitaciones de la síntesis FM
La síntesis FM permite la creación de sonidos simulando diferentes instrumentos, pero no todos. Es por ello que os hemos hecho una tabla simplificada para que os hagáis una idea aproximada de los tipos de instrumentos que puede simular.
Tipos de instrumento | Ejemplos |
---|---|
Instrumentos metálicos y percusivos. | Campanas. Vibráfonos, Xilófonos. Gongs, platillos. |
Instrumentos de viento | Flauta. Saxófonos. Órganos |
Instrumentos de cuerdas pulsadas. | Guitarras eléctricas. Bajos Eléctricos |
Instrumentos electrónicos. | Pads y drones. Synth leads. Bajos sintetizados |
Efectos de sonido | Ruidos metálicos. Ecos. Resonancias. |
Sin embargo, su versatilidad está limitada al no poder reproducir correctamente el timbre de instrumentos como el violín y los pianos acústicos, así como instrumentos de percusión como tambores y bombos tradicionales. Aun así, y con dichos handicaps, el hecho de poder emular una gran cantidad de instrumentos demostraron que los ordenadores eran válidos para crear música de manera profesional.
Con el paso del tiempo, los chips de síntesis FM fueron sustituidos por los chips capaces de reproducir pistas de audio en PCM, las cuales no tenían problemas para reproducir cualquier tipo de sonido. No en vano, buena parte de las tarjetas de sonido para paliar las limitaciones de la síntesis FM empezaron a incorporar hardware para reproducir sonidos reproducidos por modulación por pulsos codificados, la cual fue tomando fuerza con el tiempo, especialmente con el advenimiento del CD, pero eso ya es una historia totalmente distinta.